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" Phvcocvanin exprimierende Eukarvontenzelle" 

Die Erfindung betrifft rekombinant hergestelltes Phycocyanin bzw. funktionell ak- 
tive Teile davon und nimmt die Prioritat der europaischen Patentanmeidung 04 
001 504.2 in Anspruch, auf die inhaltlich Bezug genommen wird.. 

In alien Bereichen der modernen Biologie - zB. bei der DNA-Replikation, 
Transkription, Translation oder Kontrolle des Zellzyklus sowie Signaltransduktio- 
nen spielt die Wechselwirkung zwischen Proteinen eine essentielle Rolle. Konse- 
quenterweise ist die Aufklarung dieser Ablaufe nicht mehr nur allein die Domane 
von Biochemikern. Vielmehr mussen sich nun auch Genetiker sowie Molekular- 
biologen oder Biophysiker mit der Aufklarung von Protein-Protein-Wechselwirkun- 
gen beschaftigen. 

Die Interaktionen zwischen Proteinen werden klassischerweise mit Hilfe biochemi- 
scher Methoden wie der Affinitatschromatographie oder der Immunprazipitation 
identifiziert oder quantifiziert. Haufig werden diese Methoden mit genetischen bzw. 
molekularbiologischen Verfahren kombiniert. Wird beispielsweise ein gesuchtes 
Protein von einer Bakteriophagen/cDNA Bibliothek exprimiert, kann die Interaktion 
in manchen Fallen mit einer spezifischen Protein-Sonde direkt im Lysat eines 
positiven Plaques nachgewiesen werden. 

Eine Vielzahl der Verfahren zur Untersuchung von Protein-Protein-Wechselwir- 
kungen beruht jedoch auf der Detektion dieser Wechselwirkungen in vitro. So ist 
zum einen die Obertragbarkeit der damit erzeugten Ergebnisse auf in vivo Bedin- 
gungen fraglich. Des weiteren konnen nur Wechselwirkungen detektiert werden 
von Bindungspartnern, deren Dissoziationskonstanten nicht allzu groli sind. Ande- 
renfalls wurden die zu detektierenden Wechselwirkungen den in der Regel strin- 
genten und zeitaufwendigen Waschprotokollen nicht standhalten. Diese sind aber 
ublicherweise notwendig, urn die storenden Hintergrundsignale auf ein akzeptab- 
les Mali senken zu kfinnen. Die Entwicklung von Systemen zur Untersuchung der 
Protein-Protein-Wechselwirkungen in vivo stellt daher eine besondere Herausfor- 
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In der jungeren Vergangenheit verwenden viele Wissenschaftler zur Untersuchung 
der Zellbiologie das sogenannte grune Fluoreszenzprotein (GFP) aus Aequorea 
5 victoria. Bei GFP handelt es sich urn ein fluoreszierendes Protein, dessen Klonie- 
rung und Expression in der Zwischenzeit in einer Vielzahl von Zellen und Orga- 
nismen - z. B. in Bakterien, Pflanzen- und Tierzellen - gelungen ist. Damit kann 
das GFP in der Zellbiologie beispielsweise fur die Lokalisation von Proteinen, fur 
den Nachweis einer erfolgreichen Transfektion Oder als Reportergen fur eine Ge- 
10 nexpression dienen. 

Das GFP zeigt ein Absorptionsspektrum mit zwei Peaks, namlich einen ersten 
Peak bei 395 nm und einen zweiten bei 470 nm. Dafur ist das Tyr 66 verantwort- 
lich, das in seiner Hydroxy-Form durch die Anregung bei 395 nm in die Phenolat- 
15 Form ubergeht. Diese emittiert nach entsprechender Anregung Licht einer Wel- 
lenlange von 509 nm. 

Damit liegt das Emissions- und Absorptionsspektrum des GFP genau in den 
spektralen Bereichen, in denen eine Vielzahl biologischer Substanzen eine Fluo- 

20 reszenz aufweisen. Diese naturliche Fluoreszenz biologischer Systeme - auch als 
Autofluoreszenz bekannt - geht zu nicht unerheblichen Teilen auf Flavinderivate 
Oder auf NADH- sowie NADPH-Derivate zuruck. So werden Flavine beispielsweise 
durch Licht von 380-490 nm angeregt und emittieren Licht einer Wellenlange von 
520-560 nm. NADH sowie NADPH zeigen Absorptionsmaxima bei 360-390 nm, 

25 wahrend sie die hochste Emission bei 440-470 nm aufweisen. 

Diese Autofluoreszenz uberschneidet sich daher mit dem fur das GFP Protein 
typischen Spektrum, und ist bei der Verwendung von GFP in in vivo Studien fur 
ein hohes Hintergrundrauschen verantwortlich. Dieses Hintergrundrauschen fuhrt 
30 nicht selten zu einem Verlust an Klarheit und Aussagekraft der Versuchsergeb- 
nisse. 

In der Vergangenheit wurden Verfahren entwickelt, um die Autofluoreszenz von 
der GFP Fluoreszenz zu unterscheiden. Diese Verfahren beruhen beispielsweise 
35 auf der Optimierung der fur die Fluoreszenzdetektion verwendeten optischen Filter 
oder auf der sequentiellen Anregung der Probe zunachst mit einer auf die Anre- 
gung des GFP optimierten Wellenlange und im Anschlufi daran mit einer auf die 
Autofluoreszenz optimierten Wellenlange. Die Differenz zwischen den erhaltenen 



WO 2005/093040 PCT/EP2005/000663 

3 

Meftsignalen gilt als Fluoreszenz des GFP allein. Diese letzte Methode ist als 
"Dual Wavelength Correction" bekannt Auch andere Verfahren, so beispielsweise 
die "Microscopy Image Correction" basiert letztlich auf einer Korrektur des GFP 
Fluoresz^nzsignals um den Wert der Autofluoreszenz. 

5 

Daneben wurden aufwendige Optimierungen an der eigentlichen Auswerteeinheit 
vorgenommen. So wird beispielsweise die konfokale Lasermikroskopie oder die 
Zwei- Photonen-Laserscan-Mikroskopie eingesetzit, um eine hohe Auflosung der 
Fluoreszenzsignale zu erhalten und sie somit moglichst einzelnen konkreten drei- 
10 dimensionalen oder raumlichen Strukturen innerhalb der biologischen Probe zu- 
ordnen zu konnen. Dieser letzte Ansatz geht auf Beobachtungen zuruck, dass die 
Autofluoreszenz innerhalb der Probe meist nicht homogen verteilt ist. 

Ein Groliteil der Uberlegungen zur Verbesserung der Auswertung eines GFP-Sig- 
15 nals in einer in vivo Probe setzt daher an der Gestaltung des Messverfahrens 
sowie an einer Optimierung der Detektions- oder Auswerteeinheit an. (siehe dazu 
ausfuhrlich: Billinton N und A.W. Knight: Seeing the Wood through the Trees: A 
Review of Techniques for distinguishing GFP from Cellular endogenous Autofluo- 
rescence. Analytical Biochemistry 2001 (291), 175-197). 

20 

Daneben existieren nur wenige Ansatze, das GFP durch Mutagenese so zu ver- 
andern, dass die Absorption und die Emission ins langerwellige Licht verschoben 
wird und somit den kritischen Bereich der Autofluoreszenz verlasst. So wurde z. B. 
das sogenannten Red Fluorescent Protein (RFP oder DsRed) aus Discosoma mit 

25 einem Emissionsmaximum bei 583 nm isoliert, dessen Weiterentwicklung mRFP1 
ein Absorptionsmaxlmum bei 619 nm zeigt. Diese Variante hat zwar - im Gegen- 
satz zum ursprunglichen RFP - keinen storenden zweiten Peak bei 490 nm. Es ist 
aber durch eine demgegenuber geringere Photostabilitat und Signalstarke 
gekennzeichnet (Zhang J., E. Campbell, A. Ting und Y. Tsien: Creating New FIuo- 

30 rescent Probes for Cell Biology. Molecular Cell Biology 2002 (3), S. 906-918). 

Aufgabe der vorliegenden Erfindung ist es daher, ein alternatives Fluoreszenz- 
protein insbesondere fur zellbiologische Untersuchungen, sowie ein Verfahren zu 
seiner Herstellung bereitzustellen. Dieses Protein sollte insbesondere ein Absorp- 
35 tionsmaximum im langerwelligen Bereich aufweisen. 

Gelost wird diese Aufgabe durch die Bereitstellung eines Phycocyanins oderfunk- 
tionell aktiver Teile davon, wobei das Phycocyanin bzw. dessen erfindungsge- 
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ma&e Teile im Vergleich zum nativen Phycocyanin eine Glycosylierung aufweisen. 
Des weiteren wird eine transformierte Eukaryontenzelle, insbesondere eine Hefe- 
zelle, bereitgestellt, die das erfindungsgemalie Phycocyanin bzw. dessen funktio- 
nell aktive Teile exprimiert. 

5 

Bei Phycocyaninen handelt es sich urn Phycobiliproteine, die als akzessorische 
Photosynthesepigmente aus Cyanobakterien, Rotalgen oder Cryptomonaden 
bekannt sind. In Cyanobakterien und Rotalgen liegen einzelne Phycobiliproteine 
uberwiegend aggregiert zu groflen Untereinheiten, den sogenannten Phycobiliso- 
10 men, vor. 

Die Phycobiliproteine gehoren zu der Familie homologer Proteine, die jeweils aus 
einem eng miteinander verbundenen ocp-Heterodimer bestehen. Beide Unterein- 
heiten - also sowohl die a- als auch die p-Untereinheit konnen ein oder mehrere 
Chromophoren enthalten. Die Qualitat und Anzahl der kovalent an die Proteinein- 
heit (Apo-Protein) gebunden Chromophore dient der Klassifizierung der Phycobi- 
liproteine. 

Die Phycocyanine tragen eine einzige Bilin-Einheit an der a-Untereinheit und zwei 
Biline an der p-Untereinheit. Im Vergleich dazu sind beispielsweise Phycoerythrine 
durch zwei oder drei Biline an der a-Untereinheit und drei an der p-Untereinheit 
charakterisiert. Allophycocyanine hingegen tragen an jeder Proteinuntereinheit nur 
jeweils ein Bilin. 

25 Wie bereits erwahnt, werden die Biline aufgrund ihrer Struktur unterschieden. Bei 
alien Bilinen handelt es sich jedoch ubereinstimmend um Chromophore aus einem 
linearen Tetrapyrrol, das uber eine Thioetherbindung zwischen dem C3'-Atom des 
Bilins und einem Cysteinrest der Proteineinheit kovalent an das Apo-Protein 
gebunden ist. Die Anzahl der Thioetherbindungen kann jedoch variieren. So 

30 weisen einige Biline zwei Thioetherbindungen zum Apo-Protein auf. Ebenso kann 
die Konfiguration des CS'-Atoms R oder S sein. 

Die spektroskopischen Eigenschaften der Phycobiliproteine werden wesentlich 
durch die Anzahl und die Lage der Doppelbindungen in dem Bilin bestimmt. So 
35 wird zwischen dem Phycocyanobilin (PCB), dem Phycobiliviolin (PXB), dem Phy- 
coerythrobilin (PEB) und dem Phycourobilin (PUB) unterschieden. Die zwei Thi- 
oetherbindungen zum Apo-Protein aufweisenden PEB und PUB tragen die 
Bezeichnung DiCysPEB bzw. DiCysPUB. 



15 



20 



WO 2005/093040 



5 



PCT/EP2005/000663 



Daher ist die Konformation des Bilin-Anteils fur die spektralen Eigenschaften des 
Phycobiliproteins von grafter Bedeutung. So zeigen Rontgenstrukturanalysen, 
dass das Bilin im Phycobiliprotein in der Regel eine moglichst gestreckte Konfor- 
mation einnimmt. Liegt das Bilin dagegen frei in Losung vor - wodurch es eine 
davon abweichende Konformation einnehmen kann - verschiebt sich das Absorp- 
tionsmaximum starker in den UV-Bereich. 

Das Phycocyanin ist - wie bereits erwShnt - durch ein Bilin an der a-Untereinheit 
und zwei Biline an der (3-Untereinheit gekennzeichnet. Bei dem Bilin der a-Unter- 
einheit handelt es sich stets urn ein PCB. Die (3-Untereinheit kann entweder zwei 
PCB oder aber ein PCB und PEB tragen. Im ersten Fall handelt es sich urn das C- 
Phycocyanin (C-PC), wahrend das zweite Molekul als R-Phycocyanin (R-PC) 
bezeichnet wird. Die beiden PC-Varianten unterscheiden sich allerdings in ihren 
spektralen Eigenschaften nicht wesentlich. 

Die meisten Phycobiliproteine absorbieren im Bereich von 495-650 nm. Phycocy- 
anin zeigt - je nach Literatur, Versuchsbedingungen und Ausgangsorganismus - 
ein Absorptionsmaximum bei 600-650 nm. Nach Tooley et al (Tooley A. J., Yuping 
A.C., Glazer A.N.: Biosysnthesis of a fluorescent cyanobacterial C-Phycocyanin 
holo-a subunit in a heterologous host. PNAS 2001 Vol 19) 10560 - 10565) zeigt 
das Holo-CpcA (d.h. also die a-Untereinheit des PC) ein Absorptionsmaximum 
von 619 nm und eine maximale Emission bei 641 nm. 

Diese spektralen Eigenschaften des Phycocyanins erlauben eine klare Diskrimi- 
nierung des eigentlichen Fluoreszenz-Melisignals von dem st6renden Hinter- 
grundrauschen der Autofluoreszenz und begrunden somit dessen besondere Eig- 
nung als Fluoreszenzmarker fur in v/Vo-Untersuchungen. Die Autofluoreszenz 
beruht - wie bereits oben erwahnt - im wesentlichen auf Flavin- oder NADH- bzw. 
NADPH-Derivaten, die Absorption- und Emissionsmaxima bei 360-560 nm zeigen. 

Die grundlegenden Untersuchungen zur Biosynthese des Phycocyanins wurden 
an der Rotalge Cyanidium caldarium gemacht. Dabei wurde durch 14 C- 
Markierungen des Hams deutlich, dass die Biosynthese des Phycocyanins 
zunachst die Degradation des endogenen Hams zu Biliverdin IXoc durch die 
Hamoxygenase 1 (HOI) voraussetzt. Dabei wird der Tetrapyrrolring linearisiert In 
weiteren Schritten wird das Biliverdin zu 14,16 Dihydrobiliverdin IXoc und anschlie- 
fiend zu 3 Z - Phycocyanobilin umgewandelt. 
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Diese letzten beiden Umwandlungen setzen jeweils die Gegenwart von reduzier- 
tem Ferredoxin voraus und werden durch die Ferredoxin Oxidoreduktase kataly- 
siert. Das so entstandene PCB wird durch die heterodimere Phycocyanin a PCB 
Lyase an die cc-Untereinheit des Phycobiliproteins (Apo-CpcA) geknupft Damit 
entsteht die fertige Holo-a-Untereinheit (Holo-CpcA) 

Die Biosynthese des Holo-CpcA umfafJt somit zunachst die Degradation und Urn- 
wandlung des Hams zum PCB und anschlieftend dessen enzymatische Bindung 
an die Proteinuntereinheit. Entsprechend verlauft die Biosynthese der Holo-p-Un- 
tereinheit (Holo-CpcB), wobei die Bindung der Bilin-Einheiten an das CpcB ver- 
mutlich zumindest teilweise nicht-enzymatisch erfolgt. Liegen sowohl das Holo- 
CpcA als auch das Holo-CpcB vor, dimerisieren diese zu einem "Monomer" des 
Phycocyanins. 

Die vollstandige Biosynthese des Holo-CpcA wurde erstmals in der photosyntheti- 
sierenden Blaualge Synechocystis sp. PCC 6803 erkannt und die dafur relevanten 
Gene identifiziert (Nakamura, Y., Kaneko T. f Hirosawa M., Miyajima N., Tabata S. 
(1998) Nucleic Acids Res. 26, 63-67). Die heterodimere PCB Lyase wird von den 
Genen cpcE und cpcE kodiert. Die Hamoxygenase wird durch hoxl und die 
Ferredoxin Oxidoreduktase durch das pcyA Gen kodiert. Das cpcA-Gen kodiert 
die ct-Untereinheit CpcA und das cpcB-Gen die p-Untereinheit CpcB des Phyco- 
cyanins. 

Trotz des groften Bedarfs an Fluoreszenzmarkern mit den besonderen spektralen 
Eigenschaften des Phycocyanins fur die Zellbiologie und der Kenntnis der an der 
Biosynthese beteiligten Proteine sowie deren Gene ist es bisher nicht gelungen, 
Phycocyanin oder funktionell aktive Teile daraus - wie beispielsweise das Holo- 
CpcA oder das Holo-CpcB - rekombinant in Eukaryonten zu exprimieren. 

In der Vergangenheit ist zwar die heterologe Expression des Holo-CpcA in E. coli 
gelungen (Tooley et al. a.a.O.). Dazu wurden die Zellen mit zwei Plasmiden mit 
cpcA, cpcE und cpcF Gen bzw. hoxl und pcyA transfiziert. Nach Induktion der 
Genexpression erfolgte die Biosynthese des Holo-CpcA. Auch zeigte dieses Holo- 
CpcA vergleichbare spektrale Eigenschaften wie das native Holo-CpcA. Die Aus- 
beute an Holo-CpcA war aber gering, da nur etwa ein Drittel des verfugbaren Apo- 
CpcA tatsachlich zum Holo-CpcA umgesetzt wurde. 
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In ihren Untersuchungen haben Tooley et al. evaluiert, ob moglicherweise ein 
Mangel an verfugbarem endogenen Ham in E. coli fQr die reduzierte Konversion 
von Apo-CpcA zu Holo-CpcA ursachlich ist. Dazu haben sie den transformierten 
Zellen zusatzlich 5-Aminolavulinsaure angeboten. Die zusatzliche Gabe dieser 
5 Schlusselverbindung des Ham-Stoffwechsels hat jedoch nicht zu einer Erhohung 
der Holo-CpcA Ausbeute gefuhrt. 

Die Autoren spekulieren daher dartiber, ob die fur die Expression in E. coli un- 
gunstige Codonverwertung ("Codon Usage") der Gene hoxl, pcyA, cpcE und cpcF 
10 fur die mangelhafte Ausbeute verantwortlich sein konnte. Des weiteren konnte 
eine ungleiche Anzahl der jeweils in einer E. co//-Zelle vorliegenden Piasmide - die 
entweder hoxl und pcyA oder aber cpcA T cpcE und cpcF tragen - eine Rolle spie- 
len (siehe dazu auch Tooley et aL a. a.O. Seite 10564 rechte Spalte oben). 

15 Auch andere Arbeitsgruppen haben bereits vor langer Zeit die Vorteile der Ver- 
wendung von Phycobiliproteinen als Marker fur intrazellulare Vorgange in vivo er- 
kannt und daher versucht, Systeme zur Bereitstellung von Holo-CpcA in Hefen zu 
etablieren. Dazu wurden beispielsweise die Gene cpcE und cpcF fur die heterodi- 
mere PCB-Lyase sowie das cpcA-Gen zu Kodierung des Apo-a-CPCA in die He- 

20 fen kloniert. Durch eine anschlieliende Gabe exogenen PCB war beabsichtigt, ein 
funktionelles Holo CpcA - das heifit also einen funktionell aktiven Teil des Phyco- 
cyanins - in den Hefen zu generieren. Dieser Versuch der semisynthetischen Be- 
reitstellung des Holo-CpcA in Hefen schlug jedoch fehl. (Schroder B.G. (1997) 
Doctorial Dissertation (University of California, Berkeley): Phycobiliprotein: Bio- 

25 synthesis and Applications) 

Die moglichen Ursachen fur den fehlgeschlagenen Versuch, funktionell aktive 
Teile des Phycocyanins durch die Addition exogenen PCBs an rekombinant er- 
zeugtes Apo-CpcA in Hefen zu generieren, wird von Schroder ausfuhrlich disku- 
30 tiert. So konnte er durch die Wahl geeigneter Versuchsbedingungen ausschlieften, 
dass die fehlende Addition des PCB an CpcA durch einen moglicherweise fehlen- 
den Import des externen PCB in die Zelle oder aber durch einen aktiven Export 
des zunachst importierten PCB aus der Zelle heraus bedingt war. 

35 Er schlofi aufgrund seiner Untersuchungen daher aus, dass die Additionsreaktion 
der in das Hefegenom einklonierten CpcE CpcF Lyase aufgrund einer unzurei- 
chenden Konzentration an PCB ausblieb. Er folgerte aus seinen Untersuchungen 
des weiteren, dass in der Hefe ein die Additionsreaktion hemmender Inhibitor vor- 
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handen sein mull, und verweist fur die Zukunft auf die IVIoglichkeit, Hefemutaten 
zu identifizieren, die diesen Inhibitor nicht aufweisen. 

Ferner spekuliert Schroder auf die Moglichkeit, nach einer Aufklarung des voll- 
5 standigen Biosynthesewegs die dafur relevanten Gene in die Hefe einzuklonieren 
und somit eine vollstandige in vivo Biosynthese zu erreichen (siehe zu der Diskus- 
sion dieses Problems auch Schroder a. a. O. Seite 77-79). Eine eindeutige Erkla- 
rung fur das Scheitern seiner Bestrebungen zur Bereitstellung einer semi-syntheti- 
schen Biosynthese bleibt Schroder aber schuldig. 

10 

In diesem Zusammenhang sei nochmals darauf hingewiesen, dass es Tooley et 
al. aber selbst nach der Aufklarung des Biosynthesewegs nicht gelungen ist, eine 
zufriedenstellende Expression in E. coffzu erreichen (siehe oben). 

15 Vor dem Hintergrund dieses Stands der Technik ist es urn so uberraschender, 
dass nun erstmals die Transformation einer Eukaryontenzelle gelungen ist, die ein 
Holo-CpcA als funktionell aktives Teil eines Phycocyanins exprimiert. Dabei wird in 
diesem Zusammenhang unter einem "funktionell aktiven Teil" jedes Teil, Analogon 
oder Derivat des Phycocyanins verstanden, das zu mindestens einer der Phyco- 

20 cyanin a- oder p-Untereinheiten (oder Teilen davon) eine strukturelle Homologie 
aufweist und in seinen spektralen Eigenschaften im wesentlichen denjenigen Ei- 
genschaften des nativen Phycocyanins entspricht. 

* 

In einer besonders bevorzugten Ausfuhrungsform exprimiert die erfindungsge- 
25 malie Eukaryontenzelle das Holo-CpcA. Dazu kann die Eukaryontenzelle vor- 
zugsweise mit den Genen cpcE und cpcF fur die PCB- Lyase, dem hoxl fur die 
Hamoxygenase, dem pcyA fur die Ferrodoxin-Reduktase und dem cpcA fur die oc- 
Untereinheit transformiert sein. Damit kann eine vollstsndig endogene Biosyn- 
these des Holo-CpcA in einem heterologen eukaryontischien Wirt erreicht werden. 

30 

Ebenso ist es aber auch moglich, das Holo-CpcA uber einen semisynthetischen 
Biosyntheseweg bereitzustellen. Dazu kann es ausreichen, das CpcA oder CpcB - 
oder zumindest den jeweils fur die Addition des PCB relevanten Teils davon - so- 
wie die PCB Lyase in der Eukaryontenzelle zu exprimieren und PCB exogen hin- 
35 zuzufuhren. Alternativ konnen auch ein oder mehrere dar anderen fur die Biosyn- 
these relevanten Gene entweder einkloniert werden oder aber ihr jeweiliges Gen- 
produkt extern hinzugefugt werden. Damit ist es moglich — in Abhangigkeit von der 
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jeweiligen konkreten Fragestellung des Versuchs — das System gezielt zu induzie- 
ren. Mit der anschlieftenden Isolierung des Holo-CpcA oder HoIo-CpcB aus der 
Wirtszelle steht das erfindungsgema&e "funktione II aktive Teil" des Phycocyanins 
bereit. 

5 

In dem Fall, dass sowohl das Holo-CpcA als au ch das Holo-CpcB in der Zelle 
exprimiert werden - entweder vollstandig endogen oder aber semisynthetisch wie 
oben beschrieben - k6nnen die beiden Untereinheiten dimerisieren und ein kom- 
plettes Phycocyanin-Monomer bilden. ErfindungsgemafJ kann somit nicht nur ein 
10 Teil des Phycocyanins, sonderh auch ein vollstandiges Phycocyanin bereitgestellt 
werden. 

Das erfindungsgemaft bereitgestellte Phycocyanin bzw. dessen funktionell aktive 
Teile weisen ein Glycosylierungsmuster auf, das sie von dem jeweils nativen Pro- 
15 tein oder der entsprechenden Proteinuntereinheit unterscheidet. So ist beispiels- 
weise das in einem eukaryontischen Wirt exprimi^rte CpcA an dem Threonin der 
Position 6, dem Serin an Position 10 und dem S&rin an Position 162 der Amino- 
sauresequenz Dber eine O-Verknupfung glykosyliert. Diese Glykosylierungen lie- 
gen im nativen CpcA nicht vor. 

20 

Ein besonderer Vorteil des erfindungsgemalien Fluoreszenzproteins besteht darin, 
dass sein Emissionsspektrum im Vergleich mit seinen bisher bekannten Expressi- 
onsformen eine Rotverschiebung zeigt. Bei einem pH von 8,0 liegt das Emissi- 
onsmaximum des Holo-CpcA bei 643 nm und damit urn 2 nm weiter im langerwel- 
25 ligen Bereich als beispielsweise das in E.coli expri mierte CpcA. Selbst wenn die- 
ser Unterschied quantitativ nicht groli ist, kann er in der Praxis aber dazu dienen, 
dieses Signal von Signalen anderer Fluoreszenzfarbstoffe zu unterscheiden. 

In einer besonders vorteilhaften Ausfuhrungsform der Erfindung wird das Holo- 
30 CpcA in einer transformierten Hefezelle exprimiert. Dazu eignet sich insbesondere 
der unter der Aufnahmenummer DSM 16134 am "15. Januar 2004 bei der Deut- 
schen Sammlung von Mikroorganismen und Zelllculturen GmbH (DSMZ) hinter- 
legte Hefestamm. 

35 Es hat sich gezeigt, dass die heterologe Expressio n von Holo-CpcA nicht nur ab- 
hangt von der erfolgreichen Klonierung der fur die Biosynthese erforderlichen 
Gene in die Wirtszelle, sondern auch durch eine geeignete Wahl der Kultivie- 
rungsbedingungen der Wirtszelle beeinflulibar ist- Dabei kQnnen insbesondere 
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Kultivierungsbedingungen eine Rolle spielen, die die Konzentration an verfugba-. 
rem endogenen Ham in der Wirtszellen beeinflussen. So kann eine Stimulierung 
der Ham-Biosynthese oder aber eine Hemmung des zellularen Harm-Abbaus zu 
einer Erhohung der endogenen Ham-Konzentration fuhren. 

Die insgesamt 8 Schritte umfassende Biosynthese des Hams ist seit langem be- 
kannt und die dafur in der Hefe verantwortlichen Gene sind bereits identifiziert 
(z.B. R. Labbe-Bois, P. Labbe: Tetrapyrrol and Heme biosysnthesis in the yeast 
Saccharomyces cerevisiae. In: H.A: Dailey (Ed.) Biosynthesis of Heme and 
Chlorophylls, Mc Graw-Hill, New York, 1990, 235-286 oder A. Chelstowska, J. 
Rytka: Heme bioysnthesis in the yeast Saccharomyces cerevisiae. Postpy Bio- 
chem. 39 (1993) 173-185). Die Regulationsmechanismen dieses Syntheseweges 
sind jedoch noch nicht vollstandig verstanden. Es hat sich abergezeigt, dass die 
Produktionsrate des Hams u.a. von der verwendeten Kohlenstoffquelle im Medium 
und der SauerstoffverfQgbarkeit wahrend der Kultivierung abhangt So fQhrt die 
Gabe von Glucose zu einer Repression der Hamsynthese. Gleiches gilt fur andere 
von der Hefe fermentierbare Kohlenstoffquellen wie z.B. Galactose. Die Gabe von 
nicht-fermentierbaren Kohlenstoffquellen wie Ethanol stimuliert dagegen im Ver- 
gleich zu Glucose den Hamstoffwechsel urn das 2 - 3-fache (M. Hoffmann, M. 
Gora, Rythka J: Identification of rate-limiting steps in yeast heme b iosynthesis. 
Biochemical and Biophysical research Communications 310 (2003) 1247-1253; 
Chelstowska (1993)). 

Somit ist es fur die erfindungsgemafte Bereitstellung des rekombinanten Phycocy- 
anins bzw. dessen Teile vorteilhaft, die transformierten Hefezellen in einem Me- 
dium mit nicht-fermentierbaren Kohlenstoffquellen zu kultivieren, um die endogene 
Konzentration des verfugbaren Hams zu steigern. 

Alternativ konnen in einer vorteilhaften AusfQhrungsform des erfindungsgematien 
Herstellungsverfahrens Inhibitoren des Hamabbaus dem Kulturmedium zugesetzt 
oder in den Wirtsorganismus kloniert werden. 

Bei dem Enzym HMX1 handelt es sich um ein Homolog der Hamoxygenase, das 
der unveranderten Hefe fehlt (Protchenko O., Philpott C.C. (2003) Regulation of 
Intracellular Heme Levels by HMX1, a Homologue of heme Oxygenase , in Sacca- 
romyces cerevisiae, JBC 278:36582-36587). Da dieses Enzym uber Eisen ge- 
hemmt wird, besteht die Moglichkeit, dieses Enzym in einem konkreten Kulturme- 
dium zu hemmen, z. B. durch die Gabe von Eisen. 
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Die Konzentration an verfugbarem Ham kann erfindungsgemaft ebenso durch 
eine Oberexpression der Schlusselenzyme der HSmsynthese erfolgen. Dajzu kann 
die Porphobilinogen Synthase, die Porphobilinogen Deaminase oder die Uro- 
porphyrinogen III Decarboxylase uberexprimiert werden (Hoffmann et a J (2003) 
a.a.O.). 

Ebenso kann es - bei der Verwendung des ADH-Promotors als Promoter der 
einklonierten Gene - vorteilhaft sein, die Aktivitat des Promotors z.B. durch eine 
Erhohung der GIucose-Konzentration zu steigern. Die Erhohung der Glucosekon- 
zentration zur Steigerung der Promotoraktivitat steht zwar zunachst im Konflikt mit 
der damit verbundenen Repression des Hamstoffwechsels. Es hat sich abe^r expe- 
rimentell bestatigt, dass insbesondere eine Erhohung der Glucosekonzentration im 
Medium von dem bei der Kultivierung von Hefen ublichen 2 % auf beispielsweise 
13 % zu einer optimierten Ausbeute von rekombinantem Holo-CpcA mit einer 
Steigerung des Fluoreszenzsignals urn das mehr als 7-fache fuhrt (siehe uri ten). 

In einer besonders vorteilhaften Ausfuhrungsform wird das Kulturmedium rmit 2 % 
Ethanol versehen. Es ist bekannt, dass Ethanol einerseits als nicht ferment ierbare 
Kohlenstoffquelle den Hamstoffwechsel induziert (Hoffmann et al (293) a.a. O.), 
aber andererseits auch die Aktivitat des ADH Promotors fordert (Ruohon en, L., 
Aalto, M.K., Keranen, S.: Modifikations to the ADH1 promotor of Saccharomyces 
ceriviseae for efficient production of heterologous proteines. Journal of Biotech- 
nology 1995 (39) 193-203)a.a.O.). 

Erfindungsgemaft kann alternativ oder erganzend vorgesehen werden, den ^Abbau 
des rekombinanten Phycocyanins in der Zelle bzw. dessen Telle zu hemme n oder 
zu verzogern. Da ein Stickstoffmangel einen verstarkten Abbau der Phycocyanin 
Hexamere begunstigt (Grossman AR (1990) Chromatic adaptation and the events 
involved in phycobilisome biosynthesis. Plant, Cell and Environment 13:651 -666), 
kann eine Supplementierung mit Stickstoff dem Phycocyanin-Abbau entgegonwir- 
ken. 

Wie bereits erwShnt, wird in einer Ausfuhrungsform der Erfindung eine Hefozelle 
transformierL Dazu ist es vorteilhaft, die einklonierten PC-Gene fur die Expression 
in der Hefe zu optimieren, indem zunachst der GC-Gehalt der Gene auf einen 
durchschnittlichen Wert von 45% gebracht wird. So kann die genetische Stabilitat 
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und die Halbwertzeit der mRNA im Wirtsorganismus verlangert werden. 

Daruber hinaus kann die Effizienz der Expression noch gesteigert werden, indem 
die PC-Gene hinsichtlich ihrer Codon-Verwertung ("Codon Usage") auf den jewei- 
5 ligen Wirtsorganismus eingestellt werden. In einer besonders bevorzugten AusfOh- 
rungsform wird die Eukaryontenzelle mit einem oder mehreren Plasmiden, die 
eine oder mehrere der Oligonukleotisequenzen der SEQ. ID. No. 6-10 transfbr- 
miert. 

10 Fur die erfolgreiche Transformation des eukaryontischen Wirts werden die ausge- 
suchten PC-Gene zunachst in einen Klonierungsvektor kloniert und konnen an- 
schliefiend uber einen Integrationsvektor in das Genom der Wirtszelle stabil integ- 
riert werden. Die Gene konnen dabei auf einen oder mehrere Klonierungsvektoren 
verteilt werden. In einer besonders bevorzugten Ausfuhrungsform der Erfindung ist 

15 die Klonierung aller 5 PC-Gene in nur ein Plasmid erfolgt. 

Sofern die konstitutive Expression eines Gens auf dem Vektor oder in dem Genom 
gewunscht ist, kann diesem Gen ein konstitutiver Promotor - beispielsweise ein 
ADH-Promotor - vorgeschaltet sein. Es sind jedoch auch induzierbare Promoto ren, 
20 wie beispielsweise der GAL-Promotor moglich. Die Promotoren konnen sowohl 
jedem einzelnen Gen vorgeschaltet sein, als auch die gesamte Gruppe der Sene 
gemeinschaftlich regulieren. 

In einer bevorzugten Ausfuhrungsform wurde ein ADH Promotor gewahlt, unn die 
25 Expression der PC-Gene hoxl , cpcE, pcyA und cpcF zu ermoglichen. Der ADH 
Promotor ist dabei jedem Gen jeweils vorgeschaltet. In dieser Ausfuhrungsform 
wird das cpcA Gen Ober den GAL-Promotor reguliert. Damit kann ein induziorba- 
res System for die Biosynthese des Phycocyanins oder des Holo-a-Phycocysnins 
geschaffen werden. 

30 

Selbstverstandlich ist es alternativ auch moglich, das cpcA-Gen unter die Kon trolle 
des ADH Promotors und ein oder mehrere der ubrigen Gene unter die Kon trolle 
des GAL Promotors oder eines beliebigen anderen Promotors zu stellen. 

35 Sofern ein ADH 1 -Promotor verwendet wird, ist es von Vorteil, den ADH Promotor 
nicht in seiner ursprunglichen Lange von etwa 1500 bp zu verwenden, da sich 
erfahrungsgemali die Aktivitat des ADH1 Promotors uber die Zeit reduziert. So 
konnte beobachtet werden, dass der vollstandige Promotor im spaten expo n en- 
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tiellen Wachstum der Zellen abschaltet. 
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Nach Untersuchungen von Ruohonen et al. ist diese Eigenschaft des ADH1 Pro- 
motors auf ein stromaufwarts gelegenes 700 bp Fragment zuriickzufuhren. Die 
5 Deletion dieser Region hin zu einen "mittleren Promoter" von etwa 700 bp ist 
dagegen fur eine hohe und stabile Expression der klonierten Gene geeignet. Die 
Publikation von Ruohonen et al. wird hinsichtlich der Struktur und Lage eines 
erfindungsgemaft verwendbaren ADH1 Promotors vollumfanglich in Bezug ge- 
nommen. 

10 

In einer bevorzugten Ausfuhrungsform wird ein ADH1 Promotor mit der Nukleo- 
tidsequenz gemafi SEQ. ID. No. 5 eingesetzt. 

Da eukaryontische mRNA im Gegensatz zu prokaryontischer mRNA nicht poly- 
15 cistronisch ist, mussen die einklonierten Gene jeweils mit einer Terminationsse- 
quenz versehen sein. In einer vorteilhaften Ausfuhrungsform wird die Terminati- 
onssequenz nach Guo und Sherman eingesetzt (Guo, Z., Sherman, F. Signals 
sufficient for 3' end formation of Yeast mRNA. Mol Cell Biol 1996 (16), 2772- 
2776). Besonders bevorzugt ist die unter Ziffer 3 dargestellte Terminationsse- 
20 quenz SEQ. ID. No. 13. 

Ausfuhrungsbeispiel 

25 1 . Klonierungsstrategie 

(siehe auch Fig. f "Klonierungsstrategie: Aufbau ' und Klonierung der 
GeneA/ektoren") 

1 .1 . Klonierung und Synthese der Gene: 

30 Da die Umgebung des Startcodons erhalten bleiben soil, kommen folgende En- 
zyme in Frage: 



Enzym 


Erkennungsseq. 


Isoschizomere 


kompatible 
End en 


Recut 


BspHI 


T | CATG A 
A GTAC | T 




Ncol 
Afllil 

(AlCATGT) 


Nlalil 
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Ncol 


C | CATG G 




Afllll BspHI, 


Nlalll 


_ 


G GTAC | C 




Pcil 





BspHI und Ncol sind kompatibel und schneiden nicht in den Gensequenzen. 



Die Gene wurden uber 5' Ncol oder BspHI und 3' Xhol in die Vektoren kloniert 
5 Hierzu erhielten die Gene 5' die jeweiis nach Umgebung des Startcodons pas- 
sende Restriktionsschnittstelle. Am 3'-Ende wurde die Restriktionsschnittstelle fur 
Xhol angefugt Hier wurde darauf geachtet, dass moglichst wenige Aminosauren 
durch die Klonierung zusatzlich in die Sequenz eingefugt wurden. Aufierdem 
durfte durch das Anfugen der Xhol-Schnittstelle kein Frameshift entstehen. Dem 
10 wurde durch das Einfugen der Basen AA vor der Schnittstelle und dem Anhangen 
eines A nach der Schnittstelle Rechnung getragen. Hierdurch wurde an jedes Gen 
die Aminosauresequenz NSR angehangt, bei der sichergestellt wurde, dass sie 
nicht durch seltene Codons codiert wird. 

15 1 .2. Klonierung und Synthese der Vektoren: 

Die Vektoren sollen ein nachfolgendes Ausschneiden des gesamten Gens wahl- 
weise mit und ohne His-Tag erlauben, um einen Nachweis der Expression der 
Einzelgene zu ermoglichen. Zur Klonierung der Gene hintereinander wurde der 
HisTag jedoch weggelassen, um eventuelle Probleme mit der zusatzlichen Se- 
20 quenz zu vermeiden. 

Somit enthalten die Vektoren Ncol-Xhol oder BspHI-Xhol je mit und ohne HisTag 
sowie mit und ohne Terminationssequenz. Durch das vorliegende Design der 
Vektoren konnen die Gene in diese einklohiert und danach mit/ohne HisTag, 
25 Stopcodon und Terminationssequenz ausgeschnitten und weiter kloniert werden. 

Als Ausgangsvektor, in den die synthetisierten mcs und die Gene hintereinander 
einkloniert wurden, diente pSL1190 (s. Karte von pSL 1180 (Fig. 2); die Vektoren 
pSL1190 und pSL1180 unterscheiden sich lediglich in der Orientierung der mcs). 
30 Die bei der Synthese der vier verschiedenen mcs-Sequenzen berticksichtigten 
Restriktionsschnittstellen sind in der Figur durch Kasten kenntlich gemacht - so 
sind mehr Moglichkeiten bei der Klonierung vorhanden. Die letztlich bei der Klonie- 
rung der PC-Gene verwendeten Restriktionsschnittstellen sind in der Figur zusatz- 
lich durch einen den jeweiligen Kasten unterlegenden Strich markiert. 

35 

Beim Design der mcs fur die Vektoren wurde auf folgende Dinge geachtet: 
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die verwendeten Enzyme durfen nicht in den Promotorsequenzen schneiden 
sie durfen nicht im Ruckgrat des Vektors schneiden 

der Abstand zwischen den Restriktionsschnittstellen muss grofi genug sein, 
5 damit benachbarte Enzyme beide schneiden konnen 

die mcs mOssen in den pSL1190 kioniert werden konnen - hierzu werden die 
Enzymschnittstellen EcoRI und Hindlll an den Enden der mcs vorgesehen 
es mussen Schnittstellen zur Integration der gesamten PC-Kassette (aile 5 
Gene hintereinander kioniert) in den Vektor pRS306 vorliegen (hier: 
10 Sacl/Sall) 

In dem Vektor pRS306 muss die Moglichkeit zur Linearisierung im URA3- 
Gen (Selektionsmarker) bestehen, damit der Vektor integrieren kann und die 
Kassette genomisch integriert vorliegt. 

15 Die Sequenzen der mcs der Vektoren sind beigefugt (SEQ. ID. No. 1 - SEQ. ID 
No. 4). 

Aus den Vektoren 656 und 660 (pSL1190 mit synthetisierter mcs, die BspHI-site 
enthalt) mussen, um eine Klonierung mit BspHI durchfuhren zu konnen, drei 
20 Schnittstellen dieses Enzyms aus dem Ruckgrat des Vektors entfernt werden. 
Hierzu wird der Quik Change Multi Site Directed Mutagenesis Kit von Stratagene 
eingesetzt und der Erfolg des Experimentes durch Restriktionsanalysen der ent- 
standenen Vektoren verifiziert. 

25 Entstandene Klone bei der Vektorklonierung: (die weiter verwendeten Klone sind 
fett gekennzeichnet) 



Klon-Nr.: B 


Klonbeschreibung 


647 


GeneArt mcs-A = 03-200; Ncol/His-Tag in PCR-Script; 647 


648 


GeneArt mcs-B = 03-201; BspHI/His-Tag in PCR-Script; 648 


649 


GeneArt mcs-C = 03-215; Ncol/ohne His-Tag in PCR-Script; 649 


650 


GeneArt mcs-D = 03-216; BspHI/ohne His-Tag in PCR-Script; 650 


651 bis 653 


GeneArt mcs = 03-199 in pRS306; 651 


654, 655 


GeneArt mcs-A = 03-200 = Ncol/His-Tag in pSL1 190, 654 


656, 657 


GeneArt mcs-B = 03-201 = BspHI/His-Tag in pSL1190 656 


658, 659 


GeneArt mcs-C = 03-215 = Ncol/ohne His-Tag in pSL1 190; 658 


660, 661 


GeneArt mcs-D = 03-216 = BspHI/ohne His-Tag in pSL1 190; 660 
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682 bis 689 


QuikChange mit B656 zur Entfernung BspHI sites; 684, 685 


690 bis 697 


QuikChange mit B660 zur Entfernunq BsdHI sites; 690, 693 



1.3. Wahl und Klonierung des ADH Promotors: 

Der ADH-Promotor (Alkohol-Dehydrogenase) ist in .vielen Klonierungsvektoren 
vorhanden und fuhrt dort zu einer konstitutiven Expression nachgeschalteter 
Gene. Oftmals ist jedoch bei seiner Verwendung ein RQckgang der Expressions- 
rate des klonierten Gens bis hin zu einem kompletten Abschaiten der Expression 
nach etwa 3 Tagen festzustellen. 

Es hat sich aber gezeigt, dass ein ein 700 bp langes Stuck des originaren (kom- 
pletten) Promotors umfassender ADH Promotor zu einer Expression der klonierten 
Gene wahrend des gesamten Wachstumszyklus der Hefe fuhrt (Ruohonen et al. 
(1995)a.a.O.). 

Dieses Stuck des Promotors war der Ausgangspunkt fur den erfindungsgemafc 
verwendeten ADH-Promotor, wobei allerdings bei der Klonierung des Promotors 
die Primer fGr die PCR so gewahlt wurden, dass ein ADH-Fragment von insge- 
samt 719 bp entstand (siehe SEQ. ID. No. 5). 

Die Synthese des ADH Promotors wurde mittels PCR aus dem Genom von 
S. cerevisiae Y190 durchgeftthrt. Die Klonierung erfolgte in einer Drei-Fragmente- 
Ligation mit dem fraglichen Gen und dem Vektor zusammen. Hierfur wurde immer 
der gleiche reverse-Primer eingesetzt, der eine Ncol-Schnittstelle besitzt, da Ncol 
und BspHI kompatibel sind. Der forward-Primer besitzt jeweils eine andere ange- 
hangte Restriktionsschnittstelle, die je nach Klonierungsschritt ausgewahlt wird. 



Sequenzen der verwendeten Primer (die Restriktionsschnittstelle ist jeweils unter- 
strichen): Die zusatzlichen Basen werden benotigt, damit das Enzym das PCR- 
Fragment schneiden kann: 



ADH-Sacl-for 


CAATTAGAGC I'CA I A I CO I I II G I I G I I I CCGGG I G 


ADH-Sacll-for 


ATCCCCGCGGA'I A I CC I I I I GTIGI I I CCGGG I G 


ADH-Notl-for 


AAGGAAAAAAGCGGCCGCATATCCTTTTGTTGTTTCCG 
GGTG 
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ADH-Xbal-for 


AGCTCTAGAATATCCTTTTGTTGTTTCCGGGTG 


ADH-Bglll-for 


CGAAGATCTATATCCTTTTGTTGTTTCCGGGTG 


ADH-Ncol-rev 


G TAAG CCATGGTGTATATG AGATAGTTG ATTGTATG CTT 
GG 



2. Optimierung der Codon-Usage 

Die Codon-Usage wurde fur die Haufigkeit der Codonnutzung (Codon-Usage) von 
S. cerevis/ae optimiert. Der GC-Gehalt wurde, wenn moglich, auf einen durch- 
5 schnittlichen Wert von ca. 45 % eingestellt, urn die genetische Stabilitat der 
mRNA-Halbwertzeit zu steigem. 



Daruber hinaus wurden folgende fur die Klonierung vorgesehenen Restriktions- 
schnittstellen aus den Genen entfernt: 

10 



Gen 


Restriktionsenzym 


Position (bp) 


CpcA 


Kpnl 


312 


CpcE 


Nhe! 


779 




Ybal 


493 ' 


Hpal 


366 


Hpal 


549 



Es wurden fur die Klonierung der fur die Expression des Hoto-CpcA erforderlichen 
Gene ("PC-Gene") folgende Sequenzen verwendet: 



Gen 


SEQ. ID. No. 


cpcA 


SEQ. ID. No. 6 


cpcE 


SEQ. ID. No. 7 


cpcF 


SEQ. ID. No. 8 


hoxl 


SEQ. ID. No. 9 


pPcyA 


SEQ. ID. No. 10 


cpcB 


SEQ. ID. No. 11 



Sofern ein Holo-CpcB exprimiert werden soli, kann alternativ zum cpcA das cpcB- 
Gen einkloniert werden (SEQ. ID. No. 11). Das codiert eine Aminosauresequenz 
gemaliSEQ. ID. No. 12. 



20 3. Wahl der Terminationssequenz 
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Da eukaryotische mRNAs im Gegensatz zu prokaryontischen nicht polycistronisch 
sind, rnufi eine Termination nach jedem Gen stattfinden. Guo und Sherman (1996, 
a.a.O.) beschreiben eine synthetische DNA-Sequenz, die fur die Bildung eines 3'- 
Endes ausreicht und aus "efficiency element", "positioning element" und "poly(A) 
5 region" besteht. 

Fur unsere Zwecke wurde die Xbal-Schnittstelle entfernt und die Spacer-Region 
zwischen "efficiency element" und "positioning element" wie folgt gewahlt: 
ACTCTGTAGA (statt ACTGTCTAGA; Xbal-Schnittstelle (SEQ. ID. No. 13)). 

10 

4. Klonierung der Einzelgene und Test der Expression der Einzelgene 

Das Vorgehen bei der Klonierung der Einzelgene sowie fur den Nachweis ihrer 
erfolgreichen Expression ist schematisch in Fig. 3 dargestellt. Die Darstellung 
bezieht sich exemplarisch auf den Klon B654:pSL1190 mit Ncoi-Schnittstelle und 
15 HisTag. 

Die Linearisierung des fertigen Vektors erfolgte mit Stul. Die Transformation er- 
folgte in den Hefestamm Y190 mit URA Defizienz. 

20 Zunachst wurden Vortests mit zwei anderen Fluorophoren durchgefQhrt, urn zu 
testen, ob eine Expression der Gene hinter dem gewahlten ADH-Promotor und mit 
der eingesetzten Terminationssequenz erfolgt. 

Fur diesen Nachweis wurden die Gene einzeln jeweils mit dem ADH-Promotor in 
25 den Vektor pRS306 kloniert. Dabei handelt es sich urn einen Integrationsvektor, so 
dass die Gene anschlieliend in das Genom der Hefe integriert werden konnen. 
Damit entspricht die Situation im wesentlichen dem angestrebten Ziel, namlich 
dass die funf fur das Holo-CpcA relevanten Gene ("PC-Gene") hintereinander lie- 
gen. Als Schnittstellen zur Integration des Gens mit Promotor in den Vektor 
30 pRS306 wurde Sacl/Sall gewahlt, da so am meisten Fremdsequenz in die Hefe 
eingebracht werden kann. 

Hierzu wurden die Gene zuerst in den passenden Vektor (pSL1190 mit BspHI 
oder Ncol-site und HisTag) kloniert, urn anschlieliend in einer Drei-Fragmente Li- 
35 gation mit dem ADH-Promotor ligiert zu werden. 



Zur Durchfuhrung der Drei-Fragmente-Ligation wurden die eingesetzten DNA- 
Mengen mittels Agarosegel mit mitgefuhrtem Marker bestimmt. Danach wurden 
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die eingesetzten DNA-Mengen auf molarer Ebene ausgerechnet. Dem Vektor 
wurden 25 fmol und den beiden Inserts je 125 fnrtol eingesetzt. 

Das Zellpellet nach der Kultivierung von Protein-exprimierenden Hefen wurde mit 
5 glass beads und Vortexer aufgearbeitet. Hierbei wurden denaturierende Bedin- 
gungen gewahlt. Bei der Aufreinigung des HisTag tragenden Proteins wurden die 
Vorschriften des Herstellers der Ni-NTA-Saulchen eingehalten. 

5- Klonierung der Gene fur das Holo-CpcA hintereinander 

10 Das Vorgehen fiir die Klonierung der PC-Gene hintereinander ist schematisch in 
der Fig. 4a bis 4c dargestellt. Die Karte des Vektors mit den einklonierten PC- 
Genen zeigt Fig. 5. Die Sequenzdaten fur den Vektor enthalt SEQ. ID. No. 14. 
Sofern dem CpcA der Gal -Promoter vorgeschaltet ist, zeigt der Vektor einen Auf- 
bau nach Fig. 6. 

15 

Die Gene wurden in pSL1190 mit synthetisierter mcs ohne HisTag kloniert. Da- 
nach wurden diese Gene mit passenden Enzymen herausgeschnitten und zu- 
sammen mit dem ADH-Promotor hintereinander in den Vektor pSL1190 gesetzt. 
Dabei wurde der Erfolg der Klonierungen mittels Bakterienkolonie-PCR fiir das 

20 jeweilige Gen nachgewiesen und die Identitat der isolierten DNA wurde durch 
Testcuts verifiziert. Zusatzlich wurde der Promotoranteil der jeweils entstandenen 
Vektoren sequenziert (AGOWA), da dieser durch PCR erzeugt wurde (variierender 
forward primer mit verschiedenen Restriktionsenzymen) und Fehler vorhanden 
sein konnten. Fur diese PCR-Anwendungen wurde die proof-reading-Polymerase 

25 Pfu (Promega) eingesetzt. 

Nachdem die Gene hintereinander in dem Vektor pSL1190 vorlagen, wurde die 
gesamte Kassette Gber die Restriktionsschnittstellen Sad/Salt in den Integrations- 
vektor pRS306 kloniert. Bei diesem Klonierungsschritt wurden das cpcA-Gen mit 
30 passenden Primern und der Vektor pRS306 mittels einer PCR mit Primern, die ein 
Stuck aus dem URA3-Selektionsmarker amplifizieren, in den transformierten 
Bakterienkolonien nachgewiesen. 

Sequenz der zum Nachweis der klonierten Gene/lntegrationsvektor pRS306 ver- 
35 wendeten Primer: 

Lange des Frag- 
ments . 
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TGATTCAAGCTGTTGAAACC 


"361 bo 


rr\r*F-_row 
upur-i t/V 


GATTGCCATCTCAAGAAACG 




1 IUa-iOI 


PTGPTGGTCAAGCATACG 




n ox- rev 


GGTAGPGAAAGPAAPTTPG 




cpcM-Tor 


PTTTPGGTAPi ATTG AG AP A AGP 


Aid hn 


f\ v~\ /V 

CpC/A-ioC 


PA A AGPGTTA ATAGPGTAATPP 




nnv/A-rpv 


"1 TGACCAAC 1 C 11 Oil 1 GA TGC 


579 bp 


pcyA-rev 


AGCTTCAGACAATGGTTCAGC 




cpcE-for 


AAGATGAAACCGATAGATCACC 


609 bp 


cpcE-rev 


AAGCCTTAGATTCAGAAGATGC 




URA-pRS-for 


GAACGTGCTGCTACTCATCC 


613 bp 


URA-pRS-rev 


CGTCTCCCTTGTCATCTAAACC 





Urn das Holo-Protein mittels Western-Blot und Immunodetektion gegen den 
HisTag nachweisen zu konnen, wurde das cpcA-Gen mit HisTag hinter die Kas- 
sette mit den restlichen Genen gesetzt und dann diese vollstandige Kassette in 
5 pRS306 kloniert. Nach der Transformation mit nachfolgender Expression des 
Proteins in der Hefe wurde das Protein aufgereinigt und in einem Western Blot 
dargestellt (Fig. 7). 

Western Blot: 

10 

Fur den Western Blot wurde als primarer Antikftrper der Mouse Anti Histidine Tag 
(Serotec) 1:250 eingesetzt. Als sekundarer Antikorper diente Goat Anti Mouse Al- 
kaline Phosphatase (Dianova) 1:5000. Die Detektion erfolgte mit BCIP/NBT-Blue 
Liquid (Sigma). 

15 

Als Marker wurde der prestained SDS-Gel Marker (Invitrogen) verwendet. 
6. Spektrum des erfindungsgernaften HoIo-CpcA 

Das Spektrum (Fig. 8) des erfindungsgemSRen Holo-CpcA wurde in folgendem 
20 Puffer aufgenommen: 

Lvsepuffer: 
50 mM NaH 2 P0 4 
300 mM NaCI 
25 lOmMlmidazol 
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pH8,0 

Elutionspuffe r: 
50 mM NaH 2 P0 4 
5 300 mM NaCI 
250 mM Imidazol 
pH8,0 

Der Lysepuffer und der Elutionspuffer lag en im Verhaltnis 60% zu 40% vor. 

10 

7. Hefestamm und Kultivierungsbedingungen 

Als Wirtsorganismus fOr die erfindungsgemafie heteroioge Expression der PC- 
Gene wurde eine Uracil defiziente Variante des Y190 Stamms der Hefe verwen- 
det. Der Hefestamm Y 190 zeigte ursprQnglich folgenden Genotyp: MATa, leu2-3, 
15 Ieu2-112, ura3-52, trp1-901, his3-A200, ade2-101, GAL4-Agal80-A, URA3::GAL- 
LacZ, LYS::GAL-HIS3, cyh r . 

Zur Bereitstellung einer Uracil defizienten Y190 Hefe wurden aus diesem Stamm 
nach der Methode von Boeke ef a/. [Boeke, J., Lacroute, F. and Fink, G. R (1984). 
20 A positive selection for mutants lacking orotidine-5-phosphate decarboxylase ac- 
tivity in yeast: 5-Fluoro-orotic acid resistance. Mol. Gen. Genet 197, 345-346] He- 
fezellen selektiert, die eine Deletion des URA3-Gens aufweisen. 

Diese URA3 Deletions mutanten wurden auf YPAD-Medium oder auf beliebigen 
25 synthetischen Komplett-Medien kultiviert. Es hat sich als besonders vorteilhaft er- 
wiesen, anstelle der in der Literatur vorgeschfagenen 2 %-igen Glucose-Kon- 
zentration eine bis zu 13 %-ige Glucosekonzentration zu verwenden. Es sind aber 
alle Konzentrationen zwischen 2 und 20 % moglich. 
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Patentanspruche: 

1. Rekombinante Eukaryontenzelle synthetisierend funktionell aktives Phy- 
cocyanin oder funktionell aktive Teile daraus. 

2. Rekombinante Eukaryontenzelle synthetisierend Holo-CpcA und/oder Holo- 
CpcB. 

3. Rekombinante Eukaryontenzelle nach Anspruch 1 oder 2 exprimierend die 
heterodimere PCB Lyase sowie das Apo-CpcA und/oder das Apo-CpcB. 

4. Rekombinante Eukaryontenzelle nach Anspruch 3 exprimierend des weiteren 
eine heterologe Hamogygenase und/oder eine heterologe Ferredoxin Oxido- 
reduktase. 

5. Rekombinante Eukaryontenzelle nach einem der Anspruche 3 oder 4, 
gekennzeichnet durch eines oder mehrere der Gene hox 1, pcyA, cpcE, 
cpcF und cpcA. 

6. Rekombinante Eukaryontenzelle nach Anspruch 5 transformiert mit einem 
Vektor umfassend mindestens ein Insert mit einer der folgenden Oligonukle- 
otidsequenzen gemaft einer der SEQ. ID. No. 6 - SEQ. ID. No. 10 oder mit 
einer dieser Sequenzen komplementaren Strang hybridisierenden Oligonu- 
kleotiden. 

7. Rekombinante Eukaryontenzelle nach einem der Anspruche 1 bis 6, da- 
durch gekennzeichnet, dass mindestens eines der Gene von einem ADH 
Promotor reguliert wird, der upstream von -700 bp deletiert ist. 

8. Rekombinante Eukaryontenzelle nach Anspruch 7, dadurch gekennzeich- 
net, dass alle Gene von einem ADH Promotor reguliert werden, der 
upstream von -700 bp deletiert ist. 

9. Rekombinante Eukaryontenzelle nach Anspruch 7 oder 8, gekennzeichnet 
durch einen ADH Promotor mit der Oligonukleotidsequenz gemali SEQ. ID. 
No. 5 oder mit einer mit dem dazu komplementaren Strang hybridisierenden 
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Oligonukleotidsequenz. 

10. Rekombinante Eukaryontenzelle nach einem der vorherigen Anspruche, 
dadurch gekennzeichnet, dass sie eine Hefezelle ist. 

5 

1 1 . Hefezelle mit der DSMZ Aufnahmenummer DSM 16134. 

12. Vektor umfassend Inserts codierend fur eine Hamoxygenase, eine Ferre- 
doxin Oxidoreduktase, eine heterodimare PCB Lyase und das Apo-CpcA 

10 oder Apo-CpcB. 

13. Vektor nach Anspruch 12, gekennzeichnet durch Inserts mit den Genen 

* 

hoxl, pcyA, cpcE, cpcF und cpcA, wobei das cpcA auch durch cpcB ersetzt 
werden kann. 

14. Vektor nach Anspruch 11, gekennzeichnet durch eine oder mehrere der 
Oligonukleotide gemafi einer der SEQ. ID. No. 6 - SEQ. ID. No, 10 oder mit 
einer dieser Sequenzen komplementaren Strang hybridisierenden Oligonu- 
kleotiden. 

15. Vektor nach einem der AnsprQche 12 bis 14, dadurch gekennzeichnet, 
dass mindestens eines der Gene von einem ADH Promotor reguliert wird, 
der upstream von -700 bp deletiert ist. 

16. Vektor nach Anspruch 15, dadurch gekennzeichnet, dass alle Gene von 
einem ADH Promotor reguliert werden, der upstream von -700 bp deletiert 
ist. 

17. Vektor nach Anspruch 15 oder 16, gekennzeichnet durch einen ADH Promo- 
tor mit der Oligonukleotidsequenz gemali SEQ. ID. No. 5 oder mit einer mit 

. dem'dazu komplementaren Strang hybridisierenden Oligonukleotidsequenz. 

18. Vektor mit einer Nukleotidsequenz gemaft SEQ. ID. No. 14. 

35 19. Verfahren zur Herstellung eines Phycocyanins oder eines funktionell aktiven 
Teils davon, insbesondere Holo-CpcA oder Holo-CpcB umfassend folgende 
Schritte: 
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- Transformation einer eukaryontischen Wirtszelle mindestens mit cpcA 
oder cpcB; 

- ggf- Addition eines Phycocyanobilins (PCB) und/oder der PCB Lyase 

5 

- Isolierung des Phycocyanins, des Holo-CpcA und/oder des Holo-CpcB 
aus der Wirtszelle. 

20. Verfahren nach Anspruch 19, dadurch gekennzeichnet, dass zusatzlich 
10 auch eines oder mehrere der Gene hoxl, pcyA, cpcE und/oder cpcF rekorn- 

binant exprimiert werden. 

21. Verfahren nach einem der Anspruche 19 oder 20, dadurch gekennzeichnet, 
dass die endogene Hamkonzentration in der Wirtszelle erhoht wird. 

22. Verfahren nach Anspruch 19 bis 21 , gekennzeichnet durch die Stimulierung 
des endogenen Hamstoffwechsels in der Wirtszelle. 



23. Verfahren nach Anspruch 22, gekennzeichnet durch die Verwendung einer 
20 nicht von der Wirtszelle fermentierbaren Kohlenstoffquelle. 

24. Verfahren nach einem der Anspruche 1 9 bis 21 , gekennzeichnet durch eine 
Inhibierung des endogenen Hamabbaus in der Wirtszelle. 

25 25. Verfahren nach einem der Anspruche 19 bis 24, gekennzeichnet durch die 
ErhOhung der Gukosekonzentration im Medium der Wirtszelle auf eine Kon- 
zentration, die die Aktivitat des ADH-Promotors stimuliert. 

26. Verfahren nach Anspruch 25, gekennzeichnet durch die Gabe von min- 
30 destens 13 % Glucose. 



27. Verfahren nach einem der Anspruche 19 bis 26, gekennzeichnet durch eine 
2 %-ige Ethanolkonzentration im Kulturmedium der Wirtszelle. 

35 28. Verfahren nach einem der Anspruche 19 bis 27, gekennzeichnet durch eine 
Wirtszelle nach einem der Anspruche 1 bis 1 1 . 
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29. Verfahren nach einem der Anspruche 19 bis 26, dadurch gekennzeichnet, 
dass die Transformation mit Hilfe eines Vektors nach einem der Anspruche 
12 bis 19 erfolgt. 

* 

5 30. Rekombinantes Phycocyanin Oder funktionell aktive Teile daraus, hergesteilt 
nach einem der Anspruche 19 bis 29. 

31. Rekombinantes Phycocyanin Oder funktionell aktive Teile daraus nach An- 
spruch 30, gekennzeichnet durch eine Glykosylierung. 

10 ' 

32. Rekombinantes Phycocyanin oder funktionell aktive Teile daraus nach einem 
der Anspruche 30 oder 31, dadurch gekennzeichnet, dass die Glykosylie- 
rung an mindestens einer der Position 6, 10 oder 162 der Aminosaurese- 
quenz vorliegt. 

33. Rekombinantes Phycocyanin oder funktionell aktive Teile daraus nach einem 
der Anspruche 30 bis 32, dadurch gekennzeichnet, dass das Emissions- 
maximum im Vergleich zum nativen Phycocyanin, insbesondere zum native 
Holo-CpcA bei pH 8 in den langerwelligen Bereich verschoben ist. 

34. Rekombinantes Holo-CpcA mit einem Emissionsmaximum bei pH 8 von 643 
nm. 

35. Fusionsprotein enthaltend ein rekombinantes Phycocyanin oder funktionell 
25 aktive Teile davon, insbesondere rekombinantes Holo-CpcA, nach einem der 

Anspruche 30 bis 34. 

36. Antikorper oder Fragmente davon, dadurch gekennzeichnet, dass er spezi- 
fisch ein rekombinantes Phycocyanin nach einem der Anspruche 30 bis 34 

30 erkennt. 

37. Antikorper oder Fragmente davon, dadurch gekennzeichnet, dass er spezi- 
fisch funktionell aktive Teile des rekombinantes Phycocyanins nach einem 
der Anspruche 30 bis 34, insbesondere rekombinantes Holo-CpcA, erkennt 
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Fig. 4c 



1) ADH-Promotor (SacI/ Ncol, 1) plus cpcF aus 706 (NcoI/SacII, 4) in pSLl 190 (SacI/ 
SacII, 4) 

2) ADH-Promotor (SacII/ Ncol, 4) plus pcyA aus 71 1 (NcoI/NotI, 3) in pSLl 190 (SacII/ 
NotI, 4) mit cpcF 

3) ADH-Promotor (NotI/ Ncol, 3) plus cpcE aus 714 (BspHI/ Xbal, 2) in pSLl 190 (NotI/ 
Xbal, 3) mit cpcF und pcyA 

4) ADH-Promotor (Xbal/Ncol, 2) plus hoxl aus 808 (BspHI/ Bglll, seq) in pSLl 190 
(Xbal/ Bglll, 2) mit cpcF und pcyA und cpcE 

5) ADH-Promotor (Bglll/Ncol, 3) plus cpcA aus 703 (BspHI/ Sail, seq) in pSLl 190 
(Bglll/ Sail, seq) mit cpcF und pcyA und cpcE und hoxl 

Gesamte Kassette aus pSL1190 (Sacl/Sall, seq) in pRS306 (SacI/ Sail, seq) Test 
der konstitutiven PC-Expression 

6) GAL-Promotor (Bglll/Ncol, 3) plus cpcA aus 703 (BspHI/ Sail, seq) in pSLl 190 
(Bglll/ Sail, seq) mit cpcF und pcyA und cpcE und hoxl 

Gesamte Kassette aus pSL1190 (Sacl/Sall, seq) in pRS306 (SacI/ Sail, seq) Test 
der regulierbaren PC-Expression 
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03-200 

191 bp 



S£& ■ 0>. Uo A 



Hindlll Ncol Xhol 

A [AGC T T CjCATGGAAT C [T C GAG AC AC CATCAC CAT C AC CAT TAAGG TAT AT 
T T C G-A|AGGTACp T TAG AGC TpTGTGGTAGTGGTAGTGGTAATTCCATATA 
Ob 20b 40b 



Sacll 



AAC T C T G T AG AAAT AAAG AG T AT C AT C T T T C AAAC C GCjG G AT T G T C G C G A 
TTGA.GACATC T TT AT T T CT CAT AG T AG AAAGT T T GG|CGC C T AACAGC|GC T 

60b 80b 100b 



Nrul 



Clal 



Notl 



T C A2\AT|CGAT AT GTC T TAT G qGGCC GCT TACGAC CG T T AAC TTGTT |CTAG 
AG T T T AGC]! A T AC AG AAT A C G C C G G|C G AAT G C T G GC AA|t T G AAC AAG AT C 
100b 120b 140b 



Hpal 



Xbal 



Nhef 



Bglll 



Sail 



EcoRI 



ATT GGGp TAGCG T TG ApAT C T T TAG AAA C G |T C G A C G[AATT C 
(T AACCCGAT C|G C AAC T C T AGjAAAT C TT T GC AGCTjGC TT AA|G 

160b 180b 
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03-201 

191 bp 



£E&- CD. 1/1,2, 



Hindlll 



BspHI 



Xhol 



AJAGCT T T pATGA AAT C [T C G A GAC AC CAT C AC C AT C AC CAT TAAGG TAT AT 
TTCGAjAAGTAC|TTTAGAGCTjCTGTGGTAGTGGTAGTGGTAATTCCATATA 
Ob 20b 40 b 



Sacll 



AAC T C T GT AG AAAT AAAGAGT AT CATCTTT CAAA.C C GCJGG AT TGTCGCGA 
T T GAG AC AT C T T T AT T T C T CAT AG T AG AAAG T T TGGjCGC C T AAC AG C GC T 

60b 80b 100b 



Nrul 



Clal 



Not! 



T C AAAT|CG AT AT G T C T T A T GCjGGCC G C T T AC G AC C G T T AAC T T G T T 
AG T T T AGCjT AT AC AG AAT ACG C C G G|C G AAT GC T G G C AA|T T G AAC AAG A T C 
100b 120b 140b 



Hpal 



Xbal 



TAG 



Nhel 



Bglll 



[TAACCCGATCjGCAACT 

160b 



Sal! 



EcoRI 



AT T G G G|C TAG C G T T GA jGATC T T T AG AAAC G fTCGA C g |aATT C 

C T AGjAAAT C T T T GC AG C T|G C T T AAjG 

180b 
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03-215 

1 73 bp 



tb fa 3 



Hindlll 



Ncol 



Xhol 



St/ 



Ob 



A|AGJ!^TC|CATJ3GAATC[^^ 

T TCGAJAG GTACjC T TAGAGC T(C TATTCCATATATT GAG AC AT CTTTATTTC 

20 b 40b 



Sacll 



AGTATCATCTTTCAAACCSCjGGATTGTCGCGATCAAAT 

tgatagtagaaagtttggJcgcctaacagcgctagtttagc|ta.tacagaat 

60b 80b 100b 



Nrul 



Clal 



gatatgtctta 



Not! 



Hpal 



Xbal 



Nhel 



CTAGATTGGGCTA.GCGTTGAGA 



Bglll 



T GC|GGCCGC T TACGACCG T T AACT T GT T 

ACGC CGGjCGAAT GCT GGCAa|t T GAACAAGAT C|T AAC C CGAT? C|GC AAC TCT 
100b 1 20b 140b 



Sail 



T CT T TAGAAACG TCGACG 



EcoRI 



AATTC 



AG]AAATCTTTGCAGCT|GC TTAAjG 



160b 
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29 



03-21 6 

173 bp 



Sea. ib if- 



Hindlll 



BspHI 



Xhol 



TTCGAjAAGTACjT T TAGAGCTjCTAT T C CAT AT AT T GAG AC AT CTTTATTTC 
0b 20b 40b 



Sacll 



AG T AT CAT C T T T CAAAC CGCjGG AT T GT CG CG AT C AAAT CGAT AT G T C T T A 
T CAT AG T AG AAAG T T T GGjCGC C T AACAGCp C TAG T T T AGCjT AT AC AGAA T 

60b 80b 100b 



Nail 



Clal 



Noil 



Hpal 



tgc|ggccgcttacgaccgttaacttgtt|ctagattgggctagcgttgaga 



Xbal 



Nhel 



Bglll 



acgccgg(cgaatgctggcaa|ttgaacaagatc(taacccgatc(gcaactct 

100b 120b 140b 



Sail 



EcoRI 



T CT T TAGAAAC G |T CGA CG jAAT T C 
AG]AAAT C TTTGCAGC T|GCT TAAJG 

160b 



« 
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GAGCTcITtAT CCTTTTGTTG TTTCCGGGT& TACAAT _AT GG ACTTCCTCTT 50 
CTCGAGTATA ' GGAAAACAAC AAAGGCCCAC ATGTTA-TACC TGAAGGAGAA 

TTCTGGCAAC CAAACCCATA CATCGGGATT CCTATAJVTAC CTTCGTTGGT 100 
AAGACCGTTG GTTTGGGTAT GTAGCCCTAA GGATAT TATG GAAGCAACCA 

CTCCCTAACA TGTAGGTGGC GGAGGGGAGA TATACA^ATAG AACAGATACC 150 
GAGGGATTGT ACATCCACCG CCTCCCCTCT ATATGTTATC TTGTCTATGG 

AGACAAGACA TAATGGGCTA AACAAGACTA CACCAf^TTAC ACTGCCTCAT 200 
TCTGTTCTGT ATTACCCGAT TTGTTCTGAT GTGGTT7AATG TGACGGAGTA 

TGATGGTGGT ACATAACGAA CTAATACTGT AGCCCTTAGAC TT GAT AG CCA 250 
ACTACCACCA TGTATTGCTT GAT TAT GAC A TCGGGJVTCTG AACTATCGGT 

TCATCATATC GAAGTTTCAC TACCCTTTTT CCATTTGCCA TCTATTGAAG 300 
AGTAGTATAG CTTCAAAGTG ATGGGAAAAA GGTAAf^CGGT AGATAACTTC 

TAATAATAGG CGCATGCAAC TTCTTTTCTT TTTTTTTCT.T TTCTCTCTCC 350 
AT TAT TAT CC GCGTACGTTG AAGAAAAGAA AAAAA2\AGAA AAGAGAGAGG 

CCCGTTGTTG TCTCACCATA TCCGCAATGA CAAAA2=lAATG ATGGAAGACA 4 00 
GGGCAACAAC AGAGTGGTAT AGGCGTTACT GTTTTTTTAC TACCTTCTGT 

CTAAAGGAAA AAATTAACGA CAAAGACAGC ACCAACAGAT GTCGTTGTTC 450 
GATTTCCTTT TTTAATTGCT GTTTCTGTCG TGGTTGTCTA CAGCAACAAG 

CAGAGCTGAT GAGGGGTATC TCGAAGCACA CGAAAOTTTT TCCTTCCTTC 500 
GTCTCGACTA CTCCCCATAG AGCTTCGTGT GCTTT OAAAA AGGAAGGAAG 

ATTCACGCAC ACTACTCTCT AATGAGCAAC GGTAT^CGGC CTTCCTTCCA. 550 
TAAGT GCGTG TGAT GAGAGA TTACTCGTTG CCATA.TGCCG GAAGGAAGGT 

GTTACTTGAA TTTGAAATAA AAAAAAGTTT GCTGT CTTGC TATCAAGTAT 600 
CAATGAACTT AAACTTTATT TTTTTTCAAA CGACA^GAACG ATAGTTCATA 

AAATAGACCT GCAATTATTA ATCTTTTGTT TCCTCGTCAT TGTTCTCGTT 650 
TTTATCTGGA CGTTAATAAT TAGAAAACAA AGGA&CAGTA ACAAGAGCAA 

CCCTTTCTTC CTTGTTTCTT TTTCTGCACA AT ATT* TCAAG CTATACCAAG 700 
GGGAAAGAAG GAACAAAGAA AAAGACGTGT TATAAvAGTTC GATAT G j GTTC 

CATACAATCA ACTATCTCAT AT AG ACC AT G G 750 
GTATGTTAGT T G A TAG AG T A TATGTj GGTAC C 
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TCATGAAGAC CCCATTGACC GAAGCTGTTT CTACCGCAGA TT CTCAAGGT 50 
AGTACTTCTG GGGTAACTGG CTTCGACAAA GATGGCGTCT A2VGAGT TCC A 

AGATTCTTGT CATCTACCGA ATTGCAAATT GCTTTCGGTA GP^TTGAGACA 100 
T CT AAGAAC A • GTAGATGGCT TAACGTTTAA CGAAAGCCAT CT7AACTCTGT 

AGCAAATGCT GGTTTGCAAG CTGCTAAGGC TTTGACCGAT Af^CGC TCAAT 150 
TCGTTTACGA CCAAACGTTC GACGATTCCG AAACTGGCTA TTGCGAGTTA 

CTTTGGTTAA TGGTGCTGCT CAAGCTGTTT ACAACAAGTT CCCATACACC 200 
GAAACCAATT ACCACGACGA GTTCGACAAA TGTTGTTCAA GGGTATGTGG 

ACTCAAACCC AAGGTAACAA CTTCGCTGCA GATCAAAGAG G1TAAGGATAA 250 
TGAGTTTGGG TTCCATTGTT GAAGCGACGT CTAGTTTCTC C^TTCCTATT 

GTGTGCTAGA GATATTGGTT ACTACTTGAG AATTGTTACC T-ACTGTTTGG 300 
CACACGATCT CTATAACCAA TGATGAACTC TTAACAATGG A.TGACAAACC 

TTGCAGGTGG TACTGGTCCA TTGGATGAAT ACTTGATTGC T GGTATTGAT 350 
AACGTCCACC ATGACCAGGT AACCT AC T T A TGAACTAACG A*.CCATAACTA 

GAAATTAACA GAACCTTCGA TTTGTCTCCA TCTTGGTACG TT TGAAGC ATT 4 00 
CTTTAATTGT CTTGGAAGCT AAACAGAGGT AGAACCATGC ^ACTTCGTAA 

GAAGTACATT AAGGCAAATC ATGGTTTATC TGGTGATGCT Z^GAGATGAAG 4 50 
CTTCATGTAA TTCCGTTTAG TACCAAATAG ACCACTACGA TCTCTACTTC 

CAAACTCTTA CTTGGATTAC GCTATTAACG CTTTGTCTAA CTCGAG 500 

GTTTGAGAAT GAACCTAATG CGATAATTGC GAAACAGATT GAGCTC 

^— Meets 
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'TCATGAGTGA accaaacttg aacccagctt ACACCTTGGA TCAAGCTATT 50 . 
AGTACTCACT TGGTTTGAAC TTGGGTCGAA TGTGGAACCT AGTTCGATJAA 

GCAAACTTGC AACAAACCGA AGATGCTTCT. GCTAGATACT ATGCTGCT 1 TG 100 
CGTTTGAACG TTGTTTGGCT TCTACGAAGA CGATCTATGA TACGACGA.AC 

GTGGATTGGT AGATTCAGAG CTGCTCAACC AGAAACCATT GCTGCTT!TGT 150 
CACCTAACCA TCTAAGTCTC GACGAGTTGG TCTTTGGTAA CGACGAAf^CA 

TGGTTGCTTT GGAAGATGAA ACCGATAGAT CACCAGATGG TGGTTACCCA 200 
ACCAACGAAA CCTTCTACTT TGGCTATCTA GTGGTCTACC ACCAAT GGGT 

TTGAGAAGAA ACGCTGCTAA GGCTTTGGGT AAATTGGGTG ATAGACA?\GT 250 
AACTCTTCTT TGCGACGATT CCGAAACCCA TTTAACCCAC TATCTGTTCA 

TGTTCCAGCT TTGATTAAGG CTTTGGAATG TGAAGATTAC TACGTTAGAG 300 
ACAAGGTCGA AACTAATTCC GAAACCTTAC ACTTCTAATG ATGCAAT <CTC 

AATCTGCTGC TCAAGCATTG GAAGGTTTGG GTGATGCTAG AGCTATG<3CT 350 
TTAGACGACG AGTTCGTAAC CTTCCAAACC CACTACGATC TCGATACCGA 

CCATTGATGG CTAAGTTGAC CGGTGGTTTG GCTGCTGCTC AATTGGT TGA 400 
GGTAACTACC GATTCAACTG GCCACCAAAC CGACGACGAG TTAACCAJVCT 

AGGTAAGCCA CATTTGGCTC AACCATACGA AGCTATCATT GAAGCATTGG 4 50 
TCCATTCGGT GTAAACCGAG TTGGTATGCT TCGATAGTAA CTTCGTA^CC 

GTACTTTGCA AGCTGTTGAA TCT AT TGGTT TGATTGAACC ATTCTTGGAA 500 
CAT G AAACG T TCGACAACTT AGATAACCAA ACTAACTTGG TAAGAACCTT 

CATTTCTCAC CAAAGGTTCA ATACGCTGCT GCTAGAGCTT TGTTCC£\ATT 550 
GTAAAGAGTG GTTTCCAAGT TATGCGACGA CGATCTCGAA ACAAGGTTAA 

GACCGGTGAT AACAGATACG GTGATTTGTT GATTACCGCT TTGGGTGGTA 600 
CTGGCCACTA TTGTCTATGC CACTAAACAA CTAATGGCGA AACCCACCAT 

■ 

CAGATTTGCA AT T G AGAAG A TCAGCTATGA TGGATTTGGG TGCTACTGGT 650 
GTCTAAACGT TAACTCTTCT AGTCGATACT ACCTAAACCC ACGATGJACCA 

TACTTACCAG GTGCTCAAGC TATTGCTAAG GCTTTCGCTG AAAACT" CTTT 700 
ATGAATGGTC CACGAGTTCG ATAACGATTC CGAAAGCGAC TTTT GA.GAAA 

GAAGTTGATT GCTTTGAGAG ATTTGTGGGC TACCCATAGA CAAAGA^CAAG 750 
CTTCAACTAA CGAAACTCTC TAAACACCCG ATGGGTATCT GTTTCT7GTTC 

CATCTTCTGA ATCTAAGGCT TTGTCTCCAG CTTCAAGACA AATTTT7GGAA 800 
GTAGAAGACT TAGATTCCGA AACAGAGGTC GAAGTTCTGT TTAAAACCTT 

TTGATGGATT CTTTGTTGAA CTCGAG 850 
AACTACCTAA GAAACAACTT GAGCTC 
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CCATGGAAGG TAACTCTGTT GTTACCCCAG AAATTGAAAG ATTGATTCAA 50 
GGTACCTTCC ATTGAGACAA CAATGGGGTC TTTAACTTTC TAACTAAGTT 

GCTGTTGAAA. CCGCAGATTC TGCTGCTAAG TTAGTTGGTG CTGTTAGAGC 100 
CGACAACTTT GGCGTCTAAG ACGACGATTC AATCAACCAC GACAATCTCG 

TTTGGCTGCT AC C AG AT C AC CATTGGCTGT TCCACAATTG ACCACCGTTT 150 
AAACCGACGA TGGTCTAGTG- GTAACCGACA AGGTGTTAAC TGGTGGCAAA 

TGAGATACAA CAACCCAGGT GCTGCTGTTG CTGCAGTTGA TGGTTTGATT 200 
ACTCTATGTT GTTGGGTCCA CGACGACAAC GACGTCAACT ACCAAACTAA 

CAAATTGGTG ATGCTGCTAT GACCCATTTG TTGGCAAACA TGGATGGTTA 250 
GTTTAACCAC TACGACGATA CTGGGTAAAC AACCGTTTGT ACCTACCAAT 

CAACTACGGT GCTAGAGCTT GGGCTACTAG AGCTTGTGCT GGTATTGGTG 300 
GTTGATGCCA CGATCTCGAA CCCGATGATC TCGAACACGA CCATAACCAC 

ATCCAAGAGC TTTGGCTTTG TTGCAAGAAG CTGCTTTGAC CGATTTCGCT 350 
TAGGTTCTCG AAACCGAAAC AACGTTCTTC GACGAAACTG GCTAAAGCGA 

TTGTCTGTTA GAAGAGCTGC TGCTAAGGGT TTGGGTTTCT TGAGATGGCA 4 00 
AACAGACAAT CTTCTCGACG ACGATTCCCA AACCCAAAGA ACTCTACCGT 

ATCTTTGCCA CAAGAAGAAC AAGAAACCGT TCAAAAGGCT ATT T AC G ATA 4 50 
TAGAAACGGT GTTCTT'CTTG TTCTTTGGCA AGTTTTCCGA TAAA,TGCTAT 

CCTTGATTCA AGTTTGTGAA GAT CCAGAAT GGGTTGTTAG ATACGGTGCT 500 
GGAACTAAGT TCAAACACTT CTAGGTCTTA CCCAACAATC TATGCCACGA 

ATTGCTGGTT TGGAAAACT T GGCTAAGCAA GCTCAACATT ACAGACAACC 550 
TAACGACCAA ACCTTTTGAA CCGATTCGTT CGAGTTGTAA TGTCTGTTGG 

ATTGAAGGAT TTCTTGCAAT CTTTCGTTGA AC AAGAAC C A GAAGCTATTG 600 

TAACTTCCTA AAGAACGTTA GAAAGCAACT TGTTCTTGGT CTTCGATAAC 

s — ytor. 

TTGGTGAAAG AATTTTGTGG ACCTTGGAAA ACATTGGTCC AATTAACTCG 650 
AACCACTTTC ' TTAAAACACC TGGAACCTTT TGTAACCAGG TTAATTGAGC 

AG 700 
TC 
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TCATGAGTGT AAACTTGGCT TCACAATTGA GAGAAGGTAC TAAGAAGTCT 50 

AGTACTCACA TTTGAACCGA AGTGTTAACT CTCTTCCATG ATTCTTCAGA 

CATTCTATGG CTGAAAACGT TGGTTTCGTT AAGTGTTTCT TGAAGGGTGT 100 

GTAAGATACC GACTTTTGCA ACCAAAGCAA TTCACAAAGA ACTTCCCACA 

TGTTGAAAAG AACTCTTACA GAAAGTTAGT TGGTAACTTG TACTTCGTTT 150 

ACAACTTTTC TTGAGAATGT CTTTCAATCA ACCATTGAAC AT GAAGCAAA 

ACTCTGCTAT GGAAGAAGAA ATGGCTAAGT TCAAGGATCA TCCAATTTTG 200 

T GAGACGAT A CCTTCTTCTT TACCGATTCA AGTTCCTAGT AGGTTAAAAC 

TCTCATATCT ACTTCCCAGA AT TGAAC AG A AAGCAAT CTT TGGAACAAGA 250 

AGAGTATAGA TGAAGGGTCT TAACTTGTCT TTCGTTAGAA ACCTTGTTCT 

TTTGCAATTC TACTACGGTT CAAACTGGAG ACAAGAAGTT AAGATTTCTG 300 

AAACGT TAAG ATGATGCCAA GTTTGACCTC TGTTCTTCAA TTCTAAAGAC 

CTGCTGGTCA AGCATACGTT GAT AGAGT T A GACAAGTTGC TGCTACCGCT 350 

GACGACCAGT TCGTATGCAA CTATCTCAAT CTGTTCAACG ACGATGGCGA 

CCAGAATTGT TGGTTGCTCA TTCTTACACG AGATACTTGG GTGATTTGTC 400 

GGTCTTAACA ACCAACGAGT AAGAATGTGG TCTATGAACC CACTAAACAG 

TGGTGGTCAA ATTTTGAAGA AGATTGCTCA AAACGCTATG AACTTGCATG 450 

ACCACCAGTT TAAAACTTCT TCTAACGAGT TTTGCGATAC TTGAACGTAC 

ATGGTGGTAC TGCTTTCTAC GAATTTGCAG ATATTGATGA TGAAAAGGCT 500 

TACCACCATG ACGAAAGATG CTTAAACGTC TATAACTACT ACTTTTCCGA 

TTCAAGAACA CCTACAGACA AGCTATGAAC GATTTGCCAA TTGATCAAGC 550 

AAGTTCTTGT GGATGTCTGT TCGATACTTG CTAAACGGTT AACTAGTTCG 

TACCGCTGAA AGAATTGTTG ATGAAGCAAA CGATGCTTTC GCTATGAACA 600 

ATGGCGACTT TCTTAACAAC TACTTCGTTT GCTACGAAAG CGATACTTGT 

TGAAGATGTT CAACGAATTG GAAGGTAACT T GAT TAAG GC TATTGGTATT 650 

ACTTCTACAA GTTGCTTAAC CTTCCATTGA ACT AAT T CCG ATAACCATAA 

ATGGTTTTCA ACTCTTTGAC CAGAAGAAGA TCACAAGGTT CTACCGAAGT 700 

TACCAAAAGT TGAGAAACTG GTCTTCTTCT AGTGTTCCAA GATGGCTTCA 

TGGTTTGGCT ACCTCTGAAG GTAACTCGAG 750 
ACCAAACCGA TGGAGACTTC CATTGAGCTC 

* — *&clT-/ 
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CCATGGCTGT TACCGATTTG TCTTTGACCA ACTCTTCTTT GATGCCAACC 50 
GGTACCGACA ATGGCTAAAC AGAAACTGGT TGAGAAGAAA CTACGGTTGG 

TTGAACCCAA TGATTCAACA ATTGGCTTTG GCTATTGCTG CTTCTTGGCA 100 
AACTTGGGTT ACTAAGTTGT TAACCGAAAC CGATAACGAC GAAGAACCGT 

ATCTTTGCCA TTGAAGCCAT ACCAATTGCC AGAAGATTTG GGTTACGTTG 150 
TAGAAACGGT AACTTCGGTA TGGTTAACGG TCTTCTAAAC CCAATGCAAC 

AAGGCAG AT T GGAAGGTGAA AAGTTGGTTA T T GAAAAC AG ATGTTACCAA 200 
TTCCGTCTAA CCTTCCACTT TTCAACCAAT AACTTTTGTC TACAATGGTT 

ACCCCACAAT TCAGAAAGAT GCATTTGGAA TTGGCTAAAG TTGGTAAGGG 250 
TGGGGTGTTA AGTCTTTCTA CGTAAACCTT AACCGATTTC AACCATTClCC 

TTTGGATATT TTGCATTGTG TTATGTTCCC AGAACCATTG TACGGTTTGC 300 
AAACCTATAA AACGTAACAC AATACAAGGG TCTTGGTAAC ATGCCAAACG 

CATTGTTCGG TTGTGATATT GTTGCTGGTC CAGGTGGTGT TTCTGCTGCT 350 
GTAACAAGCC AACACTATAA CAACG AC C AG GTCCACCACA AAGACGACGA 

ATTGCAGATT TGTCTCCAAC CCAATCAGAT AGACAATTGC CAGCTGCTTA 400 
TAACGTCTAA ACAGAGGTTG GGTTAGTCTA TCTGTTAACG GTCGACGAAT 

CCAAAAGTCT TTGGCTGAAT TGGGTCAACC AGAATTTGAA CAACAAAGAG 4 50 
GGTTTTCAGA AACCGACTTA ACCCAGTTGG TCTTAAACTT GTTGTTTCTC 

AATTGCCACC TTGGGGTGAA ATTTTCTCTG AATACTGTTT GTTCATTAGA 500 
T T AACGG T GG AACCCCACTT TAAAAGAGAC T TAT G AC AAA CAAGTAATCT 

CCATCAAACG TTACCGAAGA AGAAAGATTC GTTCAAAGAG TTGTTGATTT 550 
GGTAGTTTGC AATGGCTTCT TCTTTCTAAG CAAGTTTCTC AACAACTAAA 

CTTGCAAATT CAT TGT CATC AATCTATTGT TGCTGAACCA TTGTCTGAAG 600 
GAACGTTTAA GTAACAGTAG TTAGATAACA ACGACTTGGT AACAGACTTC 

CTCAAACTTT GGAACATAGA CAAGGTCAAA TTCATTACTG TCAACAACAA 650 
GAGTTTGAAA CCTTGTATCT GTTCCAGTTT AAGTAATGAC AGTTGTTGTT 

CAAAAGAACG ATAAGACCAG AAGAGTTTTG GAAAAGGCTT TCGGTGAAGC 700 
GTTTTCTTGC TATTCTGGTC TTCTCAAAAC CTTTTCCGAA AGCCACTTCG 

ATGGGCTGAA AGATACATGT CTCAAGTTTT GTTCGATGTT ATTCAAAACT 750 
TACCCGACTT TCTATGTACA GAGTTCAAAA CAAGCTACAA TAAGTTTTGA 



CGAG 
GCTC 



800 
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ATGTTCGACGTATTCACTCGGGTTGTTTCCCAAGCTGATGCTCGCGGCGAGTACCT 

CTCTGGTTCrCAGTTAGATGCTTTGAGCGCTACCGTTGCTGAAGGCAACAAACGG 

ATTGATTCTGTTAACCGCATCACCGGTAATGCTTCCGCTATCGTITCCAACGCTGC 

TCGTGCTTTGTTCGTTGAACAGCCCCAATTAATCCAACCCGGTGGAAACGCCTAC 

ACCAGCCGTCGTATGGCTGCTtGTTTGCGTGACATGGAAATCATCCTCCGCTATGT 

TACCTACGCAACCTTCACCGGCGACGCTTCCGTTCTAGAAGATCGTTGCTTGAAC 

GGTGTCCGTGAAACCTACGTTGCCCTGGGTGTTCCCGGTGCTTCCGTAGCTGCTGG 

CGTrCAAAAAATGAAAGAAGCTGCCCTGGACATCGTTAACGATCCCAATGGCATC 

ACCCGTGGTGATTGCAGTGCTATCGTTGCTGAAATCGCTGGTTACTTCGACCGCG 
CCGCTGCTGCCGTAGCCTAG 
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MTO VFTRVVS Q ADARGEYLS GSQIX) ALS ATVAEGNKRID S VNRTTGNAS ATVSNAAR 

AL^VEQPQLIQPGGNAYTSRFJVLAACL^ 

ETWALGWGASVAAGVQKMKEAAIJDIVNDPN^^ 

VA 
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TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGAC 

GGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAA.GCCCGTCAGGGCGC 

GTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAG 

ATTGTACTGAGAGTGCACCACGCTTTTCAATTCAAT^ 

TTTTTTTGATTTCGGTTTCITrG 

GAAGAACGAAGGAAGGAGCACAGACTTAGATTGGTATATATACGCATATGTAGT 

GTTGAAGAAACATGAAATTGCCCAGTATTCTTAACCCAACTGCACAGAACAAAA 

ACCTGCAGGAAACGAAGATAAATCATGTCGAAAGCTACATATAAGGAACGTGCT 

GCTACTCATCCTAGTCCTGTTGCTGCCAAGCTATTTAATATCATGCACGAAAAGC 

AAACAAACITGTGTGCTTCATTGGATGTTCGTACCACCAAGGAATTACTGGAGTT 

AGTTGAAGCATTAGGTCCCAAAATTTGTTTACTAAAAACACATGTGGATATCTTG 

ACTGATTTTTCCATGGAGGGCACAGTTAAGCCGCTAAAGGCATTATCCGCCAAGT 

ACAATTTTTTACTCTTCGAAGACAGAAAATTTGCTGACATTGGTAATACAGTCAA 

ATTGCAGTACTCTGCGGGTGTATACAGAATAGCAGAATGGGCAGACATTACGAAT 

GCACACGGTGTGGTGGGCCCAGGTATTGTTAGCGGTTTGAAGCAGGCGGCAGAA 

gaagtaacaaaggaacctagaggccttttgatgttagcagaattgtcatgcaag 

ggctccctatctactggagaatatactaaggGtactgttgacattgcgaagagcg 

acaaagattttgttatcggcirrattgctcaaagagacatgggtggaagagatga 

aggttacgattggttgattatgacacccggtgtgggtttagatgacaagggagac 

gcattgggtcaacagtatagaaccgtggatgatgtggtctctacaggatctgaca 

ttattattgttggaagaggactatttgcaaagggaagggatgetaaggtagagg 

gtgaacgttacagaaaagcaggctgggaagcatatttgagaagatgcggccagc 

aaaactaaaaaactgtattataagtaaatgcatgtatactaaactcacaaattag 

a<3ctrcaatttaattatatcagttattaccctgcggtgtgaaataccgcacagat 

gcgtaaggagaaaataccgcatcaggaaattgtaaacgttaatattttgttaaaa 

TTCGCGTTAAATTTTTGTTAAATCAGCTCATTTTTTAACCAATAGGCCGAAA 
CAAAATCCCTTATAAATCAAAAGAATAGACCGAGATAGGGTTGAGTGTTGTTCCA 

gtttggaacaagagtccactattaaagaAcgtggactccaacgtcaaagggcga 
aaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagtt 
ttttgk3ggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagccccc 
gatttagagcttgacggggaaagccggcgaacgtggcgagaaaggaagggaag 

AAAGCGAAAGGAGCGGGCGCTAGGGCGGTGGCAAGTGTAGCGGTCACGCTGCGC 

GTAACCACCACACCCGCCGCGCTTAATGCGCCGCTACAGGGCGCGTCGCGCCATJ 

CGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCT 

ATTACGCCAGCTGGCGAAGGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAAC 

GCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATAC 

GACTCACTATAGGGCGAATTGGAGCTCATATCCTTTTGTTGTTTCCGGGTGTACAA 

TATGGACTTCCTCTTTTCTGGCAACCAAACCCATACATCGGGATTCCTATAATACC 

TTCGTTGGTCTCCCTAACATGTAGGTGGCGGAGGGGAGATATACAATAGAACAGA 

TACCAGACAAGACATAATGGGCTAAACAAGACTACACCAATTACACTGCCTCATT 

GATGGTGGTACATAACGAACTAATACTGTAGCCCTAGACTTGATAGCCATCATCA 

TATCGAAGTTTCACrACCCTTTTTCCATTTGCCATCTATTGAAGTAATAATAGGCG 

CATGCAACTTCTTTTCTTTTTTTTTCTTT^ 

T CC GC AATGAC AAAAAAATGATGG AAGACACTAAAGGAAAAAATTAAC GAC AAA 
GACAGCACCAACAGATGTCGTTGTTCCAGAGCTGATGAGGGGTATCTCGAAGCAC 
ACGAAACTTTTTCCrrCCTTCATTCACGCACACTACTCTCTAATGAGCAACGGTAT 
ACGGCCTTCCTTCCAGTTACTTGAATTTGAAATAAA^ 

ATCAAGTATAAATAGACCTGCAATTATTAATCTTTTGTTTCCTCGTCATTGT^ 
GTTCCCTTTCTTCCrrGTTTCTTTTTCTGCACAATATTTCAAGCT 
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CAATCAACTATCTCATATACACCATGGAAGGTAACTCTGTTGTTACCCCAGAAAT 

TGAAAGATTGATTCAAGCTGTTGAAACCGCAGATTCTGCTGCTAAGTTAGTTGGT 

GCrGTTAGAGCTTTGGCTGCTACCAGATCACCATTGGCrGTTCCACAATTGACCAC 

CGTTTTGAGATACAACAACCCAGGTGCTGCTGTTGCTGCAGTTGATGGTTTGATTC 

AAATTGGTGATGCTGCTATGACCCATTTGTTGGCAAACATGGATGGTTACAACTA 

CGGTGCTAGAGCTTGGGCTACTAGAGCTTGTGCTGGTATTGGTGATCCAAGAGCT 

TTGGCTTTGTTGCAAGAAGCTGCTrTGACCGATITCGCTTTGTCTGTTAGAAGAGC 

TGCTGCTAAGGGTTTGGGTTTCTTGAGATGGCAATCTTTGCCACAAGAAGAACAA 

GAAACCGTTCAAAAGGCTATTTACGATACCTTGATTCAAGTTTGTGAAGATCCAG 

AATGGGTTGTTAGATACGGTGCTATTGCTGGTTTGGAAAACTTGGCTAAGCAAGC 

TCAACATTACAGACAACCATTGAAGGATTTCTTGCAATCTITCGTTGAACAAGAA 

CCAGAAGCTATTGTTGGTGAAAGAATTTTGTGGACCTTGGAAAACATTGGTCCAA 

TTAACTCGAGATAAGGTATATAACTCTGTAGAAATAAAGAGTATCATCTTTCAAA 

CCGCGGATATCCTTTTGTTGTTTCCGGGTGTACAATATGGACTTCCTCTTT^ 

CAACCAAACCCATACATCGGGATTCCTATAATACCTTCGTTGGTCTCCCTAACATG 

TAGGTGGCGGAGGGGAGATATACAATAGAACAGATACCAGACAAGACATAATGG 

GCTAAACAAGACTACACCAATTACACTGCCTCATTGATGGTGGTACATAACGAAC 

TAATACTGTAGCCCTAGACTTGATAGCCATCATCATATCGAAGTTTCACTACCCTr 

TTTCCATTTGCCATCTATTGAAGTAATAATA^^ 

TITCITITCTCTCTCCCCCGTTGTrGTCTCACCATATCCGCAATGACAAAAAAATG 

ATGGAAGACACTAAAGGAAAAAATTAACGACAAAGACAGCACCAACAGATGTCG 

TTGTTCCAGAGCTGATGAGGGGTATCTCGAAGCACACGAAACTTTTTCCTTCCITC 

ATTCACGCACACTACTCTCTAATGAGCAACGGTATACGGCCTTCCTTCCAGTTACT 

TGAATTTGAAATAAAAAAAAGTTTGCTGTCTTGCTATCAAGTATAAATAGACCTG 

CAATTATTAATCTTITGTTTCCTCGTCATTGTrCTCGTTCCCTTTC 

TITTCTGCACAATATrrCAAGCTATACCAAGCATACAATCAACTATCTCATATACA 

CCATGGCTGTTACCGATTTGTCTTTGACCAACTCITCTTTGATGCCAACCTTGAAC 

CCAATGATTCAACAATTGGCirTGGCTATTGCTC^ 

GAAGCCATACCAATTGCCAGAAGATTTGGGTTACGTTGAAGGCAGATTGGAAGG 

TGAAAAGTTGGTTATTGAAAACAGATGTTACCAAACCCCACAATTCAGAAAGATG 

CATTTGGAATTGGCTAAAGTTGGTAAGGGTTTGGATATTTTGCATTGTGTTATGTT 

CCCAGAACCATTGTACGGTTTGCCATTGTTCGGTTGTGATATTGTTGCTGGTCCAG 

GTGGTGTTTCTGCTGCTATTGCAGATTTGTCTCCAACCCAATCAGATAGACAATTG 

CCAGCTGCTTACCAAAAGTCTTTGGCTGAATTGGGTCAACCAGAATTTGAACAAC 

AAAGAGAA.TTGCCACCTTGGGGTGAAATTTTCTCTGAATACTGTTTGTTCATTAGA 

CCATCAAACGTTACCGAAGAAGAAAGATTCGTTCAAAGAGTTGTTGATTTCTTGC 

AAATTCATTGTCATCAATCTATTGTTGCTGAACCATTGTCTGAAGCTCAAACTTTG 

GAACATAGACAAGGTCAAATTCATTACTGTCAACAACAACAAAAGAACGATAAG 

ACCAGA AGAG TTTTGGAAAAGGCTTTCGGTGAAGCATGGGCTGAAAGATACATG 

TCTCAAGTTTTGTTCGATGTTATTCAAAACTCGAGATAAGGTATATAACTCTGTAG 

AAATAAAGAGTATCATCTTTCAAACCGCGGATTGTCGCGATCAAATCGATATGTC 

TTATGCGGCCGCATATCCrTTTGTTGTTTCCGGGTGTACAATATGGACTTCCTCTTT^ 

TCTGGCAACCAAACCCATACATCGGGATTCCTATAATACCTTCGTTGGTCTCCCTA 

ACATGTAGGTGGCGGAGGGGAGATATACAATAGAACAGATACCAGACAAGACAT 

AATGGGCTAAACAAGACTACACCAATTACACTGCCTCATTGATGGTGGTACATAA 

CGAACTAATACTGTAGCCCTAGACTTGATAGCCATCATCATATCGAAGTTTCACT 

ACCCTTTTTCCATTTGCCATCTATTGAAGT^ 

CTTTTTTTTTCXITTCTCTC 

AAAATGATGGAAGACACTAAAGGAAAAAATTAACGACAAAGACAGCACCAACA 
GATGTCGTTGTTCCAGAGCTGATGAGGGGTATCTCGAAGCACACGAAACTTTTTC 
CirCCTTCATtCACGCACACTACTCTCTAATGAGCAACGGTATACGGCCTTCCTTC 
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CAGTTACTTGAATTTGAAATAAAAAAAAGTTTGCTGTCTrGCTATC 
TAGACCTGCAATTATTAATCTTTTGT^ 

CTTGTTTCTTTTTCTGCACAATATTTCAAGCTATACCAAGCATACAAT 

TCATATACACCATGAGTGAACCAAACTTGAACCCAGCTTACACCTTGGATCAAGC 

TATTGCAAACTTGCAACAAACCGAAGATGCTTCTGCTAGATACTATGCTGCTTGG 

TGGATTGGTAGATTCAGAGCTGCTCAACCAGAAACCATTGCTGCTTTGTTGGTTG 

CTTTGGAAGATGAAACCGATAGATCACCAGATGGTGGTTACCCATTGAGAAGAA 

ACGCTGCTAACKrCTTTGGGTAAATTGGGTGATAGACAAGTTGTTCCAGCTTTGAT 

TAAGGCTTTGGAATGTGAAGATTACTACGTTAGAGAATCTGCTGCTCAAGCATTG 

GAAGGTrTGGGTGATGCTAGAGCTATGGCTCCATTGATGGCTAAGTTGACCGGTG 

GTTTGGCTGCTGCTCAATTGGTTGAAGGTAAGCCACATTTGGCTCAACCATACGA 

AGCTATCATTGAAGCATTGGGTACTTTGCAAGCTGTTGAATCTATTGGTTTGATTG 

AACCATTCTTGGAACATTTCTCACCAAAGGTTCAATACGCTGCTGCTAGAGCTTTG 

TTCCAATTGACCGGTGATAACAGATACGGTGATTTGTTGATTACCGCTTTGGGTG 

GTACAGATTTGCAATTGAGAAGATCAGCTATGATGGATTTGGGTGCTACTGGTTA 

CITACCAGGTGCTCAAGCTATTGCTAAGGCTTTCGCTGAAAACTCTTTGAAGTrGA 

TTGCirrGAGA.GATTTGTGGGCTACCCATAGACAAAGACAAGCATCTTCTGAATC 

TAAGGCTTTGTCTCCAGCTTCAAGACAAATTTTGGAATTGATGGATTCTTTGTTGA 

ACrCGAGATA^GGTATATAACTCTGTAGAAATAAAGAGTATCATCTTTCAAACCG 

CGGATTGTCGCGATCAAATCGATATGTCTTATGCGGCCGCTTACGACCGTTAACTT 

GTTCTAGAATATCCTTTTGTTGTTTCCGGGTGTACAATATGGACTTCCTCTTTTCTG 

GCAACCAAACCCATACATCGGGATTCCTATAATACCTTCGTTGGTCTCCCTAACAT 

GTAGGTGGCGGAGGGGAGATATACAATAGAACAGATACCAGACAAGACATAATG 

GGCTAAACAA.GACTACACCAATTACACTGCCTCATTGATGGTGGTACATAACGAA 

CTAATACTGTAGCCCTAGACTTGATAGCCATCATCATATCGAAGTTTCACTACCCT 

TITTCCATTTGCCATCTATTGAAGTAATA^ 

TTITCTTTTCrCTCTCCCCCGTTGTTGTCTCACCATATCCGCAATGACAAAAAAAT 

GATGGAAGACACTAAAGGAAAAAATTAACGACAAAGACAGCACCAACAGATGTC 

GTTGTTCCAGAGCTGATGAGGGGTATCTCGAAGCACACGAAACTTTTTCCTTCCTT 

CATTCACGCACACTACTCTCTAATGAGCAACGGTATACGGCCTTCCTTCCAGTTAC 

TTGAATTTGAAATAAAAAAAAGTTTGGTGTCTTGCTATCAAGTATAAATAGACCT 

GCAATTATTAATCTTTTGTTTCCT^ 

TTTTTCTGeACAATATTTCAAGCTATACCAAGCATACAATCAACTATCTCATATAC 

ACCATGAGTGTAAACTTGGCTTCACAATTGAGAGAAGGTACTAAGAAGTCTCATT 

CTATGGCTGAAAACGTTGGTTTCGTTAAGTGTTTCTTGAAGGGTGTTGTTGAAAA 

GAACTCTTACAGAAAGTTAGTTGGTAACTTGTACTTCGTTTACTCTGCTATGGAAG 

AAGAAATGGCTAAGTTCAAGGATCATCCAATTTTGTCTCATATCTACTTCCCAGA 

ATTGAACAGAAAGCAATCTTTGGAACAAGATTTGCAATTCTACTACGGTTCAAAC 

TGGAGACAAGAAGTTAAGATTTCrGCTGCTGGTCAAGCATACGTTGATAGAGTTA 

GACAAGTTGCTGCTACCGCTCCAGAATTGTTGGTTGCTCATTCTTACACCAGATAC 

TTGGGTGATTTGTCTGGTGGTCAAATTTTGAAGAAGATTGCTCAAAACGCTATGA 

ACTTGCATGATGGTGGTACTGCTTTCTACGAATTTGCAGATATTGATGATGAAAA 

GGCTTTCAAGAACACCTACAGACAAGCTATGAACGATTTGCCAATTGATCAAGCT 

ACCGCTGAAAGAATTGTTGATGAAGCAAACGATGCTTTCGCTATGAACATGAAGA 

TGTTCAACGAATTGGAAGGTAACTTGATTAAGGCTATTGGTATTATGGTTTTCAAC 

TCTTTGACCAGAAGAAGATCACAAGGTTCTACCGAAGTTGGTTTGGCTACCTCTG 

AAGGTAACTCGAGATAAGGTATATAACTCTGTAGAAATAAAGAGTATCATCTTTC 

AAACCGCGGATTGTCGCGATCAAATCGATATGTCTTATGCGGCCGCTTACGACCG 

TTAACTTGTTCTAGATTGGGCTAGCGTTGAGATCTATATCCTTTTGTTGTTTCCGG 

GTGTACAATATGGACTrCCTCTTTTCTGGCAACCAAACCCATACATCGGGATTCCT 

ATAATACCTTCGTTGGTCTCCCTAACATGTAGGTGGCGGAGGGGAGATATACAAT 
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AGAACAGATACCAGACAAGACATAATGGGCTAAACAAGACTACACCAATTACAC 
TGCCTCATTGATGGTGGTACATAACGAACTAATACTGTAGCCCTAGACTTGATAG 
CCATCATCATATCGAAGTTTCACTACCCTTTTTCCATTTGCCATCTATTGAAGTAA 

TAATAGGCGCATGCAACTTCTTTTCTTTTTTTTTCTTT^ 

CTCACCATATCCGCAATGACAAAAAAATGATGGAAGACACTAAAGGAAAAAATT 

AACGACAAAGACAGCACCAACAGATGTCGTTGTTCCAGAGCTGATGAGGGGTAT 

CTCGAAGCACACGAAACTTTTTCCTTCCTTCATTCACGCACACTACTCTCTAATGA 

GCAACGGTATACGGCCTTCCTrCCAGTrACTTGAATtrGAAATAAAAAAAAGTTr 

GCTGTCTTGCTATCAAGTATAAATAGACCTGCAATTATTAATCTTTTGTTTCCTCG 

TCATTGTTCTCGTTCCCTTTCTTCCTTGTTTCTTTITCTGCACA^ 
ACCAAGCATACAA.TCAACTATCTGATATACACCATGAAGACCCCATTGACCGAAG 

CrGTTTCTACCGCAGATTCrCAAGGTAGATTCTTGTCATCTACCGAATTGCAAATT 

GCTTTCGGTAGATTGAGACAAGCAAATGCTGGTTTGCAAGCTGCTAAGGCTTTGA 

CCGATAACGCTCAATCTTTGGTTAATGGTGCTGCTCAAGCTGTTTACAACAAGTTC 

CCATACACCACTCAAACCCAAGGTAACAACTTCGCTGCAGATCAAAGAGGTAAG 

GATAAGTGTGCTAGAGATATTGGTTACTACITGAGAATTGTTACCTACTGTTTGGT 

TGCAGGTGGTACTGGTCCATTGGATGAATACTTGATTGCTGGTATTGATGAAATT 

AACAGAACCTTCGATTTGTCTCCATCTTGGTACGTTGAAGCATTGAAGTACATTA 

AGGCAAATCATGGTTTATCTGGTGATGCTAGAGATGAAGCAAACTCTTACTTGGA 

TTACGCTATTAACGCTTTGTCTAACTCGAGATAAGGTATATAACTCTGTAGAAAT 

AAAGAGTATCATCTTTCAAACCGCGGATTGTCGCGATCAAATCGATATGTCTTAT 

GCGGCCGCTTACGACCGTTAACTTGTTCTAGATTGGGCTAGCGTTGAGATCTTTAG 

AAACGTCGACCTCX5AGGGGGGGCCCGGTACCCAGCTITTGTTCCCTITAGTGAGG 

GTTAATTCCGAGCniTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTT 

ATCCGCTCACAATTCCACACAACATAGGAGCCGGAAGCATAAAGTGTAAAGCGT 

GGGGTGCCTAATGAGTGAGGTAACTCACATTAATTGCGTTGCGCTCACTGCCCGC 

TTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCG 

GGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCT 

GCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATA 

CGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGC 

CAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGG 

CTCGGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGA 

AACCCGACAGGACTATAAAGATACCAGGCGTTCCCGCCTGGAAGCTCCCTCGTGC 

GCrCrCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCG 

GGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGG 

TCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTG 

CGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCG 

CCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGT 

GCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTAT 

TrGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTC 

TTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTITrrGTTTGCAAGCAG 

CAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGG 

GGTCrGACGCTCAGTGGAACGAAAACrCACGTTAAGGGATTTTGGTCATGAGATT 

ATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCA 

ATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTG 

AGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTGCCC 

GTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAA 

TGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCC 

AGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGGAACTTTATCCGCCTCCATCCAG 

TCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGC 

GCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATG 



WO 2005/093040 



42 



PCT/EP2005/000663 



GCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTT 

GTGAAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTG 

GCCGCAGTGTTATCACTCATGG^TTATGGCAGCACTGCATAATTCTCTTACTGTCAT 

GCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGA 

GAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATA 

CCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGG 

GCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACT 

CGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGC 

AAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAAT 

GTTGAATACTCATACTCTTCCTTTTrCAATATTATTGAAGCAITrATCAGGGTrATr 

GTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGT 

TCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATC 

ATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTC 



